输出结果:
名字:哆啦A梦:伴我同行2,链接:https://movie.douban.com/subject/34913671/,日期:05月28日,类型:剧情 / 动画,地区:日本, 关注者:17983人想看
名字:迷妹罗曼史,链接:https://movie.douban.com/subject/26889600/,日期:05月28日,类型:喜剧 / 爱情,地区:中国大陆, 关注者:1730人想看
名字:岁月在这儿,链接:https://movie.douban.com/subject/35245774/,日期:05月28日,类型:纪录片,地区:中国大陆, 关注者:330人想看
名字:烈焰危情,链接:https://movie.douban.com/subject/35451266/,日期:05月28日,类型:爱情,地区:中国大陆, 关注者:12人想看
名字:九零后,链接:https://movie.douban.com/subject/35427471/,日期:05月29日,类型:纪录片,地区:中国大陆, 关注者:5324人想看
名字:疯狂海盗团,链接:https://movie.douban.com/subject/30349333/,日期:05月29日,类型:动画,地区:挪威, 关注者:33人想看
名字:匹诺曹,链接:https://movie.douban.com/subject/26886204/,日期:06月01日,类型:奇幻,地区:意大利, 关注者:9592人想看
名字:有一点动心,链接:https://movie.douban.com/subject/34454693/,日期:06月04日,类型:爱情,地区:中国大陆, 关注者:2358人想看
名字:追球,链接:https://movie.douban.com/subject/35299831/,日期:06月04日,类型:爱情,地区:中国大陆, 关注者:286人想看
名字:爱情对话框,链接:https://movie.douban.com/subject/35205733/,日期:06月04日,类型:剧情 / 爱情,地区:中国大陆, 关注者:66人想看
名字:梦境俏佳人,链接:https://movie.douban.com/subject/35430987/,日期:06月04日,类型:喜剧 / 爱情,地区:中国大陆, 关注者:11人想看
名字:诗人,链接:https://movie.douban.com/subject/5298987/,日期:06月05日,类型:剧情 / 爱情,地区:中国大陆, 关注者:7196人想看
名字:天堂电影院,链接:https://movie.douban.com/subject/1291828/,日期:06月11日,类型:剧情 / 爱情,地区:意大利, 关注者:390533人想看
名字:你好世界,链接:https://movie.douban.com/subject/30401194/,日期:06月11日,类型:爱情 / 动画 / 奇幻,地区:日本, 关注者:24832人想看
名字:比得兔2:逃跑计划,链接:https://movie.douban.com/subject/30213339/,日期:06月11日,类型:喜剧 / 动画 / 冒险,地区:澳大利亚, 关注者:4270人想看
名字:阳光姐妹淘,链接:https://movie.douban.com/subject/26924143/,日期:06月11日,类型:喜剧,地区:中国大陆, 关注者:1609人想看
名字:候鸟,链接:https://movie.douban.com/subject/30472742/,日期:06月11日,类型:剧情,地区:中国大陆, 关注者:257人想看
名字:玄夜狐影,链接:https://movie.douban.com/subject/27013532/,日期:06月11日,类型:奇幻 / 惊悚,地区:中国大陆, 关注者:161人想看
名字:乌海,链接:https://movie.douban.com/subject/34852976/,日期:06月12日,类型:剧情 / 爱情 / 悬疑,地区:中国大陆, 关注者:5849人想看
名字:2哥来了怎么办,链接:https://movie.douban.com/subject/30330751/,日期:06月12日,类型:剧情 / 喜剧,地区:中国大陆, 关注者:3514人想看
名字:超越,链接:https://movie.douban.com/subject/34917447/,日期:06月12日,类型:剧情 / 喜剧 / 运动,地区:中国大陆, 关注者:2537人想看
名字:暗恋,链接:https://movie.douban.com/subject/30449624/,日期:06月12日,类型:爱情,地区:中国大陆, 关注者:2402人想看
名字:狗果定理,链接:https://movie.douban.com/subject/35086539/,日期:06月12日,类型:剧情 / 喜剧,地区:中国大陆, 关注者:1111人想看
名字:饮料超人,链接:https://movie.douban.com/subject/35270903/,日期:06月12日,类型:动画,地区:韩国, 关注者:60人想看
名字:疯狂丑小鸭2靠谱英雄,链接:https://movie.douban.com/subject/35379259/,日期:06月12日,类型:喜剧 / 动画 / 冒险,地区:中国大陆, 关注者:47人想看
名字:潜艇总动员8:地心游记,链接:https://movie.douban.com/subject/34948442/,日期:06月12日,类型:动画,地区:中国大陆, 关注者:16人想看
import requests
from bs4 import BeautifulSoup
#请求网页豆瓣爬取成都xxx
url = "https://movie.douban.com/cinema/later/chengdu/"
# 伪装成浏览器的header
fake_headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'
}
response = requests.get(url, headers=fake_headers)
# 保存网页到本地
file_obj = open('douban.html', 'w')
file_obj.write(response.content.decode('utf-8'))
file_obj.close()
# 解析网页
# 初始化BeautifulSoup方法:利用网页字符串自带的编码信息解析网页
soup = BeautifulSoup(response.content.decode('utf-8'), 'lxml')
all_movies = soup.find('div', id="showing-soon")
for each_movie in all_movies.find_all('div', class_="item"):
all_a_tag = each_movie.find_all('a')
all_li_tag = each_movie.find_all('li')
movie_name = all_a_tag[1].text
moive_href = all_a_tag[1]['href']
movie_date = all_li_tag[0].text
movie_type = all_li_tag[1].text
movie_area = all_li_tag[2].text
movie_lovers = all_li_tag[3].text
print('名字:{},链接:{},日期:{},类型:{},地区:{}, 关注者:{}'.format(
movie_name, moive_href, movie_date, movie_type, movie_area, movie_lovers))
切换城市之后也可以实现,注意控制变量。