Python 爬取豆瓣250电影并写入Mongodb数据库

import requests
import json
import pymongo

urlList = ["https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start=" + str(n)
           for n in range(0,500,20)]

client = pymongo.MongoClient(host='localhost',port=27017,connect=False)
#创建数据库douban
douban = client['douban']
#为数据库添加账号密码管理如果没有设置就不用填写
#douban.authenticate(name="douban_user",password="")
#为数据库添加集合方便 插入数据
douban_tv = douban['douban_tv']
douban_tv.create_index([('id',1)],unique=True)

Num = 0
for url in urlList:
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
    response_data = requests.get(url,headers=headers)
    json_data = json.loads(response_data.text)
    for tv in json_data['subjects']:
        data = {
            'rate':tv['rate'],
            'title':tv['title'],
            'img_url':tv['cover'],
            'id':tv['id'],
            #构建一个新的直接加在后面的标签
            'tagd':"美剧"
        }
        Num += 1
        douban_tv.insert(data)
        print(Num,data)















评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值