爬虫2--爬取豆瓣网热映电影

1.爬取一部电影的详细内容

from bs4 import BeautifulSoup
import requests
#获取爬取的网址
url=requests.get('https://movie.douban.com/subject/24773958/')
#获取网页源代码
v_source=BeautifulSoup(url.text,'lxml')
# print(v_source)
#爬取标题
v_title=v_source.find('span',attrs={'property':'v:itemreviewed'})
# print(v_title.text)

# v_cover=v_source.find('span',attrs={'property':'v:summary'})
# print(v_cover.text)
#爬取类型
v_type=v_source.findAll('span',attrs={'property':'v:genre'})
for i in v_type:
    print(i.text)

2.爬取豆瓣网正在热映的全部电影

from bs4 import BeautifulSoup
import requests
#爬取全部正在热映的电影
url=requests.get('https://movie.douban.com/')
v_source=BeautifulSoup(url.text,'lxml')
#查看的是源代码
v_title=v_source.findAll('li',attrs={'class':'title'})

for i in v_title:
    print(i.text)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值