python新闻爬虫_python爬虫爬取新闻 新闻爬取

e00affbde1de68dc2dbca32b9afcb237.jpg

(url,r=(url,=)=(html)=(html,' html。parser ')all _ topics=soup。find _ all(' tr ')[1:]foreach _ topicinal _ topics : topic _ times=each _ topic。查找(' TD ',class_='last')#搜索指数topic_rank=each_topic.find('td ',class_='first')#排名topic_name=each_topic.find('td ',class_='keyword')#标题目iftopic_rank!=Noneandtopic _ name!=Noneandtopic_times!=none : topic _ rank=each _ topic。查找(' TD ',class_='first ').get_text().替换(',').替换('

,' ')topic_name=each_topic.find('td ',class _=' key ').get_text().替换(',').替换('

,' ')topic _ times=each _ topic。查找(' TD ',class_='last ').get_text().替换(',').替换('

,' ')#打印('排名:{},标题:{},热度:{} ' .格式(topic_rank,topic_name,topic_times))tplt='排名:{0:^4}\t标题:{1:{3}^15}\t热度:{2:^8}'print(tplt.format(topic_rank,topic_name,topic_times,chr(12288)))defmain():#百度热点排行榜单链接url='http://top.baidu.com/buzz?b=1fr=20811 ' headers={ ' User-Agent ' : ' Mozilla/5.0 ' } html=get _ html(URL,headers)get _ pages(html)if _ _ name _ _==' _ _ main _ _ ' : main()

fa50959d75aa6e1dc31e3213a8cca2f1.jpg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值