- 博客(23)
- 资源 (2)
- 收藏
- 关注
原创 pandas 分组聚合
数据链接链接:https://pan.baidu.com/s/10R1r4A27PXzqo8q99MTucw 提取码:q1bbimport pandas as pdfile_path = "C:/Users/Administrator/Desktop/starbucks_store_worldwide.csv"df = pd.read_csv(file_path)grouped ...
2020-03-31 15:17:11 387
原创 pandas 数据合并 pd.join() pd.merge() pd.crosstab() pd.concat()
文章目录1. join:默认情况下他是把行索引相同的数据合并到一起2. merge:按照指定的列把数据按照一定的方式合并到一起2.1内连接2.2 外连接2.3 左连接2.2 右连接1. join:默认情况下他是把行索引相同的数据合并到一起import pandas as pdimport numpy as npdf1 = pd.DataFrame(np.ones((2, 4)), ind...
2020-03-31 11:14:47 4198
原创 matplotlib直方图
假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据?from matplotlib import pyplot as pltfrom matplotlib import font_managera = [131, 98, 125, 131, 124, 139, 131, ...
2020-03-29 10:24:50 874
原创 matplotlib条形图
假设你获取到了2017年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据?a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:...
2020-03-27 14:37:13 386
原创 matplotlib绘制散点图
假设通过爬虫获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表y_3,y_10),要求绘制散点图from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname="C:/Windows/Fonts/simf...
2020-03-26 20:24:40 202
原创 pandas 字符串离散化的案例
统计Genre【类别】字段中单词【电影所属的类别】出现的次数数据链接:https://pan.baidu.com/s/1tL7TSqgEcF3F6EpVvb51uQ 提取码:5kj5 复制这段内容后打开百度网盘手机App,操作更方便哦import pandas as pdimport numpy as npfrom matplotlib import pyplot as pl...
2020-03-16 21:00:02 484
原创 python中的字典推导式
案例1:将字典dict1 = {“001”: “aa”, “002”: “bb”, “003”: “cc”}中的key和value互换成{‘aa’: ‘001’, ‘bb’: ‘002’, ‘cc’: ‘003’}dict1 = {"001": "aa", "002": "bb", "003": "cc"}dict2 = {}for key, value in dict1.items()...
2020-03-16 19:45:43 234
原创 python中的集合推导式
集合推导式可用来去重需求:将列表list1 = [2, 2, 2, 3, 4, 4, 4]中的偶数进行筛选,并且去重list1 = [2, 2, 2, 3, 4, 4, 4]set1 = {i for i in list1 if i % 2 == 0}print(set1)运行结果{2, 4}...
2020-03-16 19:32:39 195
原创 matplotlib折线图
案列假设一天中每隔两个小时(range(2,26,2))的气温(C)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]绘制出以下图像from matplotlib import pyplot as pltx = range(2, 26, 2)y = [15, 13, 14.5, 17, 20, 25, 26, 26, 27, 22, 18,...
2020-03-16 13:22:28 632
原创 python中的列表推导式
1.单列表,单条件求1-20之间的偶数list1 = []for i in range(1, 21): if i % 2 == 0: list1.append(i)print(list1)列表推导式list2 = [i for i in range(1, 21) if i % 2 == 0]print(list2)2.单列表,双条件有数字1,...
2020-03-15 22:08:10 342
原创 pandas 索引
一. loc方法的使用通过标签来获得1. 取点取单点取不连续的多个点2. 取行取单行取不连续的多行3. 取列取单列取不连续的多列4. 取连续的多行和不连续的多列二. iloc方法的使用通过位置来获取5. 取行取单行6. 取列取单列取不连续的多列7. 取多行和多列取不连续的多行和多列取...
2020-03-08 17:10:00 464
原创 DataFrame整体情况查询
1. df.info()的使用相关信息概览:行数,列数,列索引,列非空值个数,列类型,列类型,内存占用2. df.describe()方法的使用快速综合统计结果:计数,均值,标准差,最大值,四分位数,最小值...
2020-03-08 15:46:07 502
原创 numpy数组的属性
NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度,一维数组的秩为 1,二维数组的秩为 2,以此类推1. 查看维度(演练第一个)其他的属性类比...
2020-03-05 16:15:14 221
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人