
python数据分析
qq_43193797
github:https://github.com/yanjie666
展开
-
Numpy高级用法之:数组的ufunc广播机制
Numpy高级用法之:数组的ufunc广播机制ufunc通用函数,能够对array中所有元素进行操作的函数Broadcasting指对不同形状的array之间执行算术运算的方式不同形状的数组运算时,Numpy则会执行广播机制numpy能够运用向量化运算处理整个数组,所以速度比较快Numpy高级用法之:数组的通用函数intersectId:返回俩个数组的交集判断俩个不同array是否相等方式二:...原创 2020-09-30 15:30:05 · 634 阅读 · 0 评论 -
Numpy高级用法之:数组的形状改变
数组的形状改变• Numpy中提供了reshape等方法改变数组的形状,但不改变数据的值• 可以对数组转换为一维,即展平• 可以将多个数组,组合成一个更大的数组• 三维数组的创建和索引arr.reshape(10,2)arr.flatten()np.hstack((arr1,arr2))np.vstack((arr1,arr3))ar = np.arange(8).reshape(2,2,2)示例一:reshape示例二:resize示例三:ravel示例四:fla原创 2020-09-30 14:59:41 · 915 阅读 · 0 评论 -
numpy的花式索引
numpy的花式索引示例一:示例二示例三示例四示例五原创 2020-09-30 11:54:10 · 195 阅读 · 0 评论 -
numpy.logspace讲解
np.linespace是获取等差数列np.logspace是获取等比数列示例如下:原创 2020-09-30 10:51:59 · 734 阅读 · 0 评论 -
箱形图
最近有很多用户说到了年终需要回顾这一年的工作,根据这一年的数据看看有没有异常的情况,那么哪种图能够清晰直观地展现出这一信息呢?答案只有一个,那就是…箱形图箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。想要搞懂箱形图,那么一定要了解…五大因“数”我们一组原创 2020-09-30 10:22:19 · 1100 阅读 · 0 评论 -
seaborn基础
一:使用seaborn绘制图形,有三种方式1)plt.style.use(“seaborn”)2)sns.set()3)调用seaborn函数注:对于简单的制图,使用前俩种都可以,但对于复杂图形,可能会使用第三种方式示例一:运行结果:新增红色部分的代码:运行结果:注:实际上plt.style.use(‘seaborn’)等同于sns.set(style=‘darkgrid’,context=‘notebook’,font_scale=1.2) 等同于sns.barplot(x=原创 2020-09-30 10:18:05 · 179 阅读 · 0 评论 -
Matplotlib的subplot函数
figureMatplotlib的图像均位于figure对象中创建figure:fig = plt.figure()示例代码:# 引入matplotlib包import matplotlib.pyplot as pltimport numpy as np%matplotlib inline #在jupyter notebook 里需要使用这一句命令# 创建figure对象fig = plt.figure()运行结果:<matplotlib.figure.Figure at 0x原创 2020-09-28 18:01:05 · 537 阅读 · 0 评论 -
matplotlib绘制散点图
假设通过爬虫你获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律?a=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]b=[26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,原创 2020-09-28 17:48:20 · 217 阅读 · 0 评论 -
matplotlib描绘直方图
注意:没有处理过的原始数据才能进行直方图的绘制假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据?a=[131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128,原创 2020-09-28 17:24:36 · 331 阅读 · 0 评论 -
matplotlib描绘条形图(柱状图)
绘制单个条形图案例:假设你获取到了某年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据?a = ["战狼2”,"速度与激情8”,"功夫瑜伽”,"西游伏妖篇”,"变形金刚5:最后的骑士”,"摔跤吧!爸爸”,"加勒比海盗5:死无对证”,"金刚:骷髅岛”,"极限特工:终极回归”, "侠:英雄归来”,"悟空传”,"银河护卫队2”,"情圣”,"新木乃伊”,]b=[56.01,26.94,17.53,16.49,15.45,12.96,11.8,11.61,11.2原创 2020-09-28 11:47:11 · 915 阅读 · 0 评论 -
python中的复制
一:通过引用赋值的方法二:view方法三:通过copy方法原创 2020-09-26 09:41:42 · 176 阅读 · 0 评论 -
DataFrame分组排序
文章转载:https://blog.csdn.net/qq_24499417/article/details/87265931需要对df进行分组后排序。import pandas as pddf = pd.DataFrame([['a', 1, 'c'], ['a', 3, 'a'], ['a', 2, 'b'], ['c', 3, 'a'], ['c'...转载 2020-04-28 16:21:36 · 1410 阅读 · 0 评论 -
Numpy详细教程
NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。Numeric,即 NumPy 的前身,是由 Jim Hugunin 开发的。 也开发了另一个包 Numarray ,它拥有一些额外的功能。 2005年,Travis Oliphant 通过将 Numarray 的功能集成到 Numeric 包中来创建 N...转载 2019-12-13 16:00:46 · 185 阅读 · 0 评论