- 博客(1)
- 收藏
- 关注
原创 Python爬虫:抓取js生成的数据
之前的NLP课程作业要求爬取一些科技新闻来训练语言模型,本文就简单来说一说用Python来爬取新闻的过程。虽然以前写过简单的爬虫,但是没有处理过浏览器动态加载数据的情况,这次碰到了就记录一下。这次爬取的新闻来源是 新浪科技滚动新闻,打开之后网页长这样:该网页中包含了50条新闻,我们希望拿到上图中的新闻链接,然后发送request请求来得到新闻内容。但是查看该网页的源码后发现,这些新闻的链接并...
2019-11-09 21:35:00 6549 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人