学习python数据分析的30个练手数据+4个数据集网站

python技巧(数据分析及可视化)

已于 2022-01-19 12:50:13 修改

阅读量2w

点赞数 23

分类专栏： python数据分析技巧文章标签： python 可视化数据

于 2021-04-30 09:06:37 首次发布

本文链接：https://blog.csdn.net/muyashui/article/details/116289581

版权

python数据分析技巧专栏收录该内容

33 篇文章

订阅专栏

博主分享了12个pyechart作图模板的Excel文件和数据源，包括空气质量数据爬取。还介绍了4个数据集网址以及GoPUP这个Python公共数据工具包，提供了多个实时热点数据的获取示例，如百度热门、知乎热榜等。文章适合想要学习Python数据分析和可视化的读者。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前几天发了一个博文:懂点excel作图, 怎么让pyechart作的图更具“职场范“呢?丨pyechart工作作图模板, 一不小心上了热榜, 感谢小伙伴们的支持, 以后会多总结发更好的python数据分析及可视化的文章.
在这里插入图片描述

有朋友询问这十几个模板的数据文件, 想必是想实际操作一下, 很不错哟!
我将数据上传到了论坛, 另外分享下工作中收集数据的一些方法!

12个pyechart模板Excel文件

请点击: 模板数据下载地址
在这里插入图片描述

2个数据源

以上数据除了模拟数据外, 其他数据都是来自于网上, 主要是199it数据图表

模块 199it
在这里插入图片描述
空气质量数据来自于下面网址, 通过爬虫方式获取

爬虫代码也上传到论坛, 想了解的可以下载: 请点击

爬取的数据作图之前需要进行清洗, 原因是网址的城市名称可能和百度地图收录的城市名称不一致, 需要保持一致, 比如下面这些:

data['城市'].replace('果洛','果洛藏族自治州',inplace=True)
data['城市'].replace('可克达拉','可克达拉市',inplace=True)

4个数据(集)网址

平时可能用到的数据集网址, 分享几个方便初学者学习python。

- 天池数据集
在这里插入图片描述
- DC竞赛

- 和鲸社区

在这里插入图片描述
- 500强排名数据

在这里插入图片描述

1个python公共数据工具包: GoPUP

通过python调用工具包,能获取不少公共信息, 亲测有些接口可能获取不到数据了, 大部分还是可以的!
官网

GoPUP 项目所采集的数据皆来自公开的数据源，不涉及任何个人隐私数据和非公开数据。

在这里插入图片描述
安装方式

pip install gopup  --upgrade

调用方式

在这里插入图片描述
基本上都是几行代码, 返回的是一个dataframe格式数据, 用pandas很容易处理, 适合想学python的朋友学习使用.

import gopup as gp
df_index = gp.weibo_index(word="疫情", time_type="3month")
print(df_index)

国内生产总值

代码

import gopup as gp
df_index = gp.get_gdp_quarter()
df_index

在这里插入图片描述

居民消费价格指数

import gopup as gp
df_index = gp.get_cpi()
df_index

在这里插入图片描述

千里马公司数据

import gopup as gp
df_index = gp.maxima_company()
df_index

在这里插入图片描述

历史上的今天

import gopup as gp
df_index = gp.history_daily()
df_index

在这里插入图片描述

百度实时热门

import gopup as gp
df_index = gp.baidu_hot_list()
df_index

在这里插入图片描述

百度今日热点

import gopup as gp
df_index = gp.baidu_today_hot_list()
df_index

在这里插入图片描述

百度百科热词榜

import gopup as gp
df_index = gp.baidu_hot_word_list()
df_index

在这里插入图片描述

微博热搜榜

import gopup as gp
df_index = gp.weibo_hot_search_list()
df_index

在这里插入图片描述

微信热门榜

import gopup as gp
df_index = gp.wx_hot_list()
df_index

在这里插入图片描述

知乎热搜榜

import gopup as gp
df_index = gp.zhihu_hot_search_list()
df_index

在这里插入图片描述

知乎热榜

import gopup as gp
df_index = gp.zhihu_hot_list()
df_index

在这里插入图片描述

豆瓣新片榜

import gopup as gp
df_index = gp.douban_movie_list()
df_index

在这里插入图片描述

豆瓣一周口碑榜

import gopup as gp
df_index = gp.douban_week_praise_list()
df_index

在这里插入图片描述

汽柴油历史价格信息

import gopup as gp
df_index = gp.energy_oil_hist()
df_index

在这里插入图片描述

迁入迁出地详情

import gopup as gp
migration_area_baidu_df = gp.migration_area_baidu(area="湖北省", indicator="move_in", date="20200201")
migration_area_baidu_df

在这里插入图片描述

车站数据

import gopup as gp
df_index = gp.station_name()
df_index

在这里插入图片描述

列车时刻表

import gopup as gp
df_index = gp.train_time_table(train_number="T15")
df_index

在这里插入图片描述

全国普通高校名单

import gopup as gp
df_index = gp.university()
df_index

在这里插入图片描述
如果这些数据你正好需要, 可以方便调用, 感谢开发提供工具包的朋友!

以上就是这次整理的内容, 欢迎关注, 后期会不断更新!

学习python数据分析的30个练手数据+4个数据集网站

文章目录

12个pyechart模板Excel文件

2个数据源

4个数据(集)网址

1个python公共数据工具包: GoPUP

国内生产总值

居民消费价格指数

千里马公司数据

历史上的今天

百度实时热门

百度今日热点

百度百科热词榜

微博热搜榜

微信热门榜

知乎热搜榜

知乎热榜

豆瓣新片榜

豆瓣一周口碑榜

汽柴油历史价格信息

迁入迁出地详情

车站数据

列车时刻表

全国普通高校名单