1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

新闻 jpaser 0.0.18 发布,Python 网页正文抽取工具 下载

本帖由 漂亮的石头2017-05-25 发布。版面名称:软件资讯

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,984
    赞:
    47
    jpaser 0.0.18 发布了,jparser 是 Python 编写的网页正文抽取工具,对于资讯类页面可以自动抽取标题、正文段落和图片地址。

    0.0.18 版改进:

    1) 修复br标签问题;
    2) 提高了title提取的准确性;
    3) 图片地址绝对路径处理bug修复;
    4) 抽取结果中的杂质打压;
    5) 提高正文区域识别准确率;
    jpaser 0.0.18 发布,Python 网页正文抽取工具下载地址
     
正在加载...