爬虫之爬取豆瓣电影的名字

最新推荐文章于 2024-04-15 16:44:18 发布

dhx3970

最新推荐文章于 2024-04-15 16:44:18 发布

阅读量604

点赞数

文章标签：爬虫 python json

原文链接：http://www.cnblogs.com/lsm-boke/p/9937350.html

版权

import requests    #requests模块用于发送HTTP请求
import json        #json模块用于对JSON数据进行编解码

#新建数组用于存放多个电影数据
movielist=[]

#浏览器演示json
crawlSite="https://api.douban.com/v2/movie/in_theaters"

#像豆瓣发送请求并得到响应
res = requests.get(crawlSite)

#对响应进行编码转换，忽略编码错误
data = res.content.decode("utf-8","ignore")

#将Json对象转化为Python字典
data_dict = json.loads(data)

#获取返回数据中的电影主题数据
movielist = data_dict['subjects']

#新建一个数组，存放电影名称
movieNameList=[]

#通过遍历movielist这个数组，得到各个电影的名称，并且存放到movieNameList这个数组中
for i in range(len(movielist)):
    #通过movielist[i]['title']获取电影的名称
    #通过append将名称加入到movieNameList数组中
    #movieNameList.append(movielist[i]['title'])
    movieNameList.append(movielist[i]['title']+'==='+str(movielist[i]['rating']['average']))

#将结果打印输出
print(movieNameList)