python爬豆瓣电视剧_爬取豆瓣热门电视剧.py

import requests

from fake_useragent import UserAgent

import json

import csv

import pymongo

import random

import time

clien=pymongo.MongoClient(自己的数据库)

db=clien.dianshiju

coll=db.text

ua=UserAgent()

headers={

'User-Agent':ua.random

}

def request_json(page):

try:

url='https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start={}'.format(page)

response=requests.get(url,headers=headers)

this_is_json=json.loads(response.text)

return this_is_json

except Exception:

print('request error')

def extract_data(json):

if json:

for i in json.get('subjects'):

data = {}

data['电视图片']=i.get('cover')

data['电视名字']=i.get('title')

data['电视评分']=i.get('rate')

data['是否是新的电视剧']=i.get('is_new')

data['电视ID']=i.get('id')

coll.insert_one(data)

print(data)

def sava_csv(json):

pass

for i in range(0,1000):

page=i*20

extract_data(request_json(page))

time.sleep(random.randint(0,5))

一键复制

编辑

Web IDE

原始数据

按行查看

历史

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值