general-news-extractor-js:一个基于 Node.js 的新闻网页正文通用抽取工具,包含标题、作者、正文图片和发布日期,今日更新至 v0.04
Github | Demo
该项目启发自 kingname/GeneralNewsExtractor,由 Python 迁移到 Node.js ,并做了一些改动,提高提取准确度
👉 更新内容:开放了正文图片与返回正文源代码功能
部署方法详见 Readme,目前只支持一次抓取一个网页
频道:@NewlearnerChannel
消息来源: https://t.me/NewlearnerChannel/2522