一个简单的从微博的新浪财经爬取的财经资讯,包含资讯标题、内容和评论数量。
财经资讯爬虫的程序分为三个部分
1.导入依赖的模块
需要导入的程序接口有request、pyquery和Pandas。
2.选择爬取数据
选取的数据为新浪财经的网页
URL的获取方式:首先进入微博-新浪财经的网页,点击鼠标右键,出现如图所示的对话框,点击检查。
新浪财经网页
点击检查后进入到如图所示的页面ÿ
一个简单的从微博的新浪财经爬取的财经资讯,包含资讯标题、内容和评论数量。
财经资讯爬虫的程序分为三个部分
1.导入依赖的模块
需要导入的程序接口有request、pyquery和Pandas。
2.选择爬取数据
选取的数据为新浪财经的网页
URL的获取方式:首先进入微博-新浪财经的网页,点击鼠标右键,出现如图所示的对话框,点击检查。
新浪财经网页
点击检查后进入到如图所示的页面ÿ