1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

新闻 jpaser 0.0.18 发布,Python 网页正文抽取工具 下载

Discussion in '软件资讯' started by 漂亮的石头, 2017-05-25.

  1. 漂亮的石头

    漂亮的石头 版主 Staff Member

    Joined:
    2012-02-10
    Messages:
    487,984
    Likes Received:
    47
    jpaser 0.0.18 发布了,jparser 是 Python 编写的网页正文抽取工具,对于资讯类页面可以自动抽取标题、正文段落和图片地址。

    0.0.18 版改进:

    1) 修复br标签问题;
    2) 提高了title提取的准确性;
    3) 图片地址绝对路径处理bug修复;
    4) 抽取结果中的杂质打压;
    5) 提高正文区域识别准确率;
    jpaser 0.0.18 发布,Python 网页正文抽取工具下载地址
     
Loading...