提前声明:该专栏涉及的所有案例均为学习使用,如有侵权,请联系本人删帖!
文章目录
一、前言
今天使用一下大佬的GNE模块来测试一下几个新闻网站的识别情况吧。
GNE 的输入是经过 js 渲染以后的 HTML 代码,所以 GNE 可以配合Selenium 或者 Pyppeteer 使用。
二、什么是GNE
- GNE 官方文档:https://generalnewsextractor.readthedocs.io/zh_CN/latest/
- GNE 的项目源代码在:
提前声明:该专栏涉及的所有案例均为学习使用,如有侵权,请联系本人删帖!
今天使用一下大佬的GNE模块来测试一下几个新闻网站的识别情况吧。
GNE 的输入是经过 js 渲染以后的 HTML 代码,所以 GNE 可以配合Selenium 或者 Pyppeteer 使用。