python爬取热门信息_Python实现爬取豆瓣热门榜单

最新推荐文章于 2024-04-25 22:53:37 发布

weixin_39687422

最新推荐文章于 2024-04-25 22:53:37 发布

阅读量243

点赞数

文章标签： python爬取热门信息

声明：

1.本代码思路来源于本站UP主：python爬虫。

2.转载附原作者及本人Id，作品链接

3.本代码仅限于学习交流使用

4.请自觉遵守协定以及相关规定

全代码如下，修改path可用：

import requests

import json

class Get_Detail(object):

def __init__(self):

self.start_url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start={}"

self.urllist=[]

for i in range(9):

self.urllist.append(self.start_url.format(i*20))

#格式化添加

#生成页面列表

self.path=r"C:\Users\asus\Desktop\CS\PYTHON\应用实例\豆瓣热门.csv"

with open(self.path,"a") as file:

file.write("影名,评分,url,封面"+"\n")

#新建Excel文件并生成表头

def get_value(self,urllist):

kv={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}

cont_dict_list=[]

#存放所有页面所有信息

for each in urllist:

response=requests.get(each,headers=kv)

dictionary=json.loads(response.text)

#json格式转换为字典

dictlist=dictionary["subjects"]

#取值获得字典列表

for eachdict in dictlist:

content={}

#存放单条所需信息

content["影名"]=eachdict["title"]

content["评分"]=eachdict["rate"]

content["url"]=eachdict["url"]

content["封面"]=eachdict["cover"]

cont_dict_list.append(content)

return cont_dict_list

def save_cont(self,contlist):

for each in contlist:

title=each["影名"]

rate=each["评分"]

url=each["url"]

cover=each["封面"]

with open(self.path,"a") as file:

file.write(title+","+rate+","+url+","+cover+"\n")

def run(self):

ctls=self.get_value(self.urllist)

self.save_cont(ctls)

#自我调用

if __name__=="__main__":

gd = Get_Detail()

#实例化

gd.run()

print("OVER")

代码至此结束

效果如下

欢迎大家在评论区发表合理的意见和指正。

如果觉得该栏目对您有帮助，望不吝点赞收藏。

weixin_39687422

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。