爬虫入门四:用pyecharts展示爬取到的数据

本文是爬虫入门系列的第四部分,重点介绍了如何使用pyecharts展示爬取到的数据。通过实例展示了绘制想看人数排行榜、电影类型占比图和上映日期柱形图,并提供了整体效果展示。此外,还提到了pyecharts的一个x轴和y轴转换后的y轴刻度显示问题及其临时解决方案。
摘要由CSDN通过智能技术生成

爬虫入门四(续三)

文末附教程博客链接,感兴趣可以去看一下。

分享一个pyecharts学习网址:
Python:数据可视化pyecharts的使用.

用pyecharts展示爬取到的数据
绘制想看的人数(热度)排行榜:
import requests
from bs4 import BeautifulSoup
from pyecharts import Page, Pie, Bar

url = "https://movie.douban.com/cinema/later/chengdu/"
response = requests.get(url)
soup = BeautifulSoup(response.content.decode('utf-8'), 'lxml')
all_movies = soup.find('div', id = "showing-soon")
#建立存储所有电影信息的集合
all_movies_info = []
for each_movie in all_movies.find_all('div', class_ = "item"):
    all_a = each_movie.find_all('a')
    all_li = each_movie.find_all('li')
    movie_name = all_a[1].text
    movie_href = all_a[1]['href']
    movie_date = all_li[0].text
    movie_type = all_li[1].text
    movie_area = all_li[2].text
    movie_lovers = all_li[3].text
    all_movies_info.append({
   'name': movie_name, 'date': movie_date, 'type': movie_type, 
                            'area': movie_area, 'lovers': movie_lovers.replace('人想看', '')})
#print(all_movies_info)
#按‘想看的人数’排序
#sorted函数,第一个参数是一个可以遍历的对象,key参数接受一个匿名函数,用以指定以遍历对象内作为排序的依据的元素
sort_by_lovers = sorted(all_movies_info, key = lambda x: int(x[<
  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值