python爬新闻动态_Python爬取新闻动态评论

本文介绍了如何使用Python爬取新闻动态的评论。通过分析网页结构,发现评论数据存储在JSON格式中,通过Chrome开发者工具获取JSON数据的URL,然后使用Python的json模块解析数据。文中提到的代码主要针对第一页评论的爬取,涉及的关键技术包括JSON数据的获取与解析。
摘要由CSDN通过智能技术生成

四年前的文章了,现在才看见没通过。。。。当初明明过了的。。。

1.前些天打开网易新闻,于是点开爬取该新闻的评论。

2.以前爬取的网页都是静态的,都是源代码中直接就有,一眼就可以观察到的,而这次打开却不一样,根本没有自己想要的评论内容。然后通过搜索学习,知道了获取数据的办法。主要是html中的JavaScript和Python中json模块。

具体步骤如下:

1.输入网址,用谷歌浏览器获取json数据

输入网址后,按F12,出现该界面

2.查找所需要的数据

观察加载的这些内容可以发现,有图片,有html文件等。一开始并不知道评论内容存在哪里,搜索html依次查看

点击Preview进行查看,发现红框里的内容才是需要的数据

3.点击headers获取url

这个url只有一个,加载的是“热门跟帖”的内容,而加载“最新跟帖”的到现在有17个

打开一个网址,是以json数据进行显示的

这里附了张图,应该不合法。。。。

其他的页面的显示形式也是相同的。

4.写代码爬取数据,一开始只对一页内容进行爬取

一开始从来没有接

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值