python爬取豆瓣top250电影名称_Python 爬取豆瓣电影Top250(一)

from bs4 import BeautifulSoup

import requests

import time

import pymongo

#创建数据库

client = pymongo.MongoClient('localhost', 27017) #激活客户端

douban = client['douban']

url_list = douban['url_list']

item_list = douban['item_info']

start_url = ['https://movie.douban.com/top250?start={}&filter='.format(str(i)) for i in range(0, 250, 25)]

urlone = 'https://movie.douban.com/top250?start=0&filter='

#获取某页各电影的信息(影名,链接,评分,评论数,一句话影评)

def get_index_url(url):

wb_data = requests.get(url)

soup = BeautifulSoup(wb_data.text, 'lxml')

titles = soup.select('div.hd > a > span.title')

links = soup.select('div > div.info > div.hd > a ')

scores = sou

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值