![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
·Jormungand
我会把这个不完美的故事 变成我所期望的样子
展开
-
Bokeh——交互式可视化库
文章目录前言如何通过Plotting绘制图形前言Bokeh是一个专门针对Web浏览器使用的交互式可视化库,这是与其他可视化库相比最核心的区别。如何通过Plotting绘制图形Plotting是以构建视觉符号为核心的接口,可以结合各种视觉元素(例如,点、圆、线等其他元素)和工具(例如,缩放、保存、重置等其他工具)创建可视化图形。使用bokeh.plotting创建图表的基本步骤如下:导入Bokeh库中用到的一些方法或函数。准备数据,这些数据既可以是普通的Python列表,也可以是Numpy数原创 2020-12-16 20:58:11 · 1559 阅读 · 1 评论 -
Seaborn——绘制统计图形
文章目录可视化数据的分布绘制单变量分布绘制双变量分布绘制成对的双变量分布可视化数据的分布绘制单变量分布一般采用最简单的直方图描述单变量的分布情况。Seaborn中提供了displot()函数。distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None,hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None,color=None, vertical=False, norm原创 2020-12-16 20:04:27 · 1883 阅读 · 1 评论 -
Matplotlib——绘制图表
文章目录通过figure()函数创建画布通过subplot()函数创建单个子图通过subplots()函数创建多个子图通过figure()函数创建画布在pyolot模块中,默认拥有一个Figure对象,该对象可以理解为一张空白的画布,用于容纳图标的各种组件,比如图例、坐标轴等。figure(num=None, # autoincrement if None, else integer from 1-Nfigsize=None, # defaults to rc figure.figsize原创 2020-12-10 20:12:31 · 2381 阅读 · 0 评论 -
Python之分组级运算——【transform()方法、apply()方法】
文章目录数据转换——transform()方法数据应用——apply()方法数据转换——transform()方法使用aggregate()方法进行聚合运算已经在上一篇博客中详细阐述,我们知道aggregate()方法返回的数据集的形状(shape)与被分组的数据集的形状是不同的,如果希望保持与原数据数据集形状相同,则可以通过transfrom()方法实现。transform(self, func, *args, **kwargs)上述方法中只有一个func参数,表示操作Pandas对象的函数原创 2020-11-25 16:40:50 · 2661 阅读 · 0 评论 -
Python之数据聚合——aggregate()方法
文章目录使用内置统计方法聚合数据面向列的聚合方法agg()方法使用内置统计方法聚合数据实现数据拆分成组并分别计算平均数的操作代码:import pandas as pdimport numpy as npdf = pd.DataFrame({'key1': ['A', 'A', 'B', 'B', 'A'], 'key2': ['one', 'two', 'one', 'two', 'one'], 'data1':原创 2020-11-24 21:32:00 · 12841 阅读 · 2 评论 -
Python之数据拆分——groupby()方法
文章目录groupby()方法通过列名进行分组通过Series对象进行分组Series对象与原数据的行索引长度相等Series对象与原数据的行索引长度不等通过字典进行分组按照columns轴的方向进行分组按照index轴的方向进行分组通过函数进行分组groupby()方法groupby(self,by=None,axis=0,level=None,as_index: bool = True,sort: bool = True,group_keys: bool = True,squee原创 2020-11-23 20:11:20 · 5375 阅读 · 0 评论 -
Python之数据转换——【rename()方法、cut()函数、get_dummies()函数】
文章目录重命名轴索引离散化连续数据哑变量处理类别型数据重命名轴索引rename(self,mapper: Optional[Renamer] = None,*,index: Optional[Renamer] = None,columns: Optional[Renamer] = None,axis: Optional[Axis] = None,copy: bool = True,inplace: bool = False,level: Optional[Level] = None原创 2020-11-20 22:42:06 · 1434 阅读 · 0 评论 -
Python之数据重塑——【stack()方法和unstack()方法、pivot()方法】
文章目录重塑层次化索引对于单层索引的DataFrame类对象stack()方法unstack()方法对于多层索引的DataFrame类对象重塑层次化索引Pandas中重塑层次化索引的操作主要是stack()方法和unstack()方法,前者是将数据的列“旋转”成行,后者是将数据的行“旋转”成列。stack(self, level=-1, dropna=True)上述方法中部分参数表示的含义如下:level:表示操作内层索引。若设为0,表示操作外层索引,默认为-1dropna:表示是否将旋原创 2020-11-20 21:25:18 · 2609 阅读 · 0 评论 -
Python之数据合并——【concat()函数、merge()函数、join()方法、combine_first()方法】
文章目录轴向堆叠数据轴向堆叠数据pandas.concat(objs: Union[Iterable[FrameOrSeriesUnion], Mapping[Optional[Hashable], FrameOrSeriesUnion]],axis=0,join=“outer”,ignore_index: bool = False,keys=None,levels=None,names=None,verify_integrity: bool = False,sort: boo原创 2020-11-20 10:04:16 · 8020 阅读 · 7 评论 -
Python更改数据类型——astype()方法和to_numeric()函数
文章目录明确指定数据的类型通过dtypes属性进行查看创建Pandas对象指定数据类型转换数据类型通过astype()方法强制转换数据的类型明确指定数据的类型通过dtypes属性进行查看import pandas as pddf = pd.DataFrame({'A': ['1', '2', '4'], 'B': ['9', '-80', '5.3'], 'C': ['x', '5.9', '0']})print("d原创 2020-11-19 17:26:28 · 41833 阅读 · 0 评论 -
Python数据预处理之异常值的处理——【自定义的three_sigma()函数、boxplot()方法】
文章目录基于3σ原则检测异常值代码实现测试基于箱型图检测异常值**输出结果:**![在这里插入图片描述](https://img-blog.csdnimg.cn/20201118164522591.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0pvcm11bmdhbmRfVg==,size_16,color_FFFFFF,t_70#pic_cen原创 2020-11-18 17:18:32 · 7125 阅读 · 1 评论 -
Pandas对象的层次化索引——【from_tuples()、from_arrays()、from_product()、swaplevel()、sort_index()、sort_values()】
文章目录层次化索引的概念层次化索引的创建使用嵌套列表的方式构造层次化索引对象Series对象DataFrame对象通过MultiIndex类的方法构建层次化索引通过from_tuples()方法创建MultiIndex对象通过from_arrays()方法创建MultiIndex对象通过from_product()方法创建MultiIndex对象层次化索引的操作选取子集获取外层索引子集获取内层索引子集交换分层顺序——swaplevel()排序分层sort_index()sort_values()层次化索原创 2020-11-15 18:03:06 · 3292 阅读 · 0 评论 -
Pandas数据排序——【按索引排序sort_index()方法、按值排序sort_value()方法】
文章目录按索引排序——sort_index()对Series排序对DataFrame排序按值排序——sort_value()对Series进行排序对DataFrame进行排序按索引排序——sort_index()sort_index(axis=0, level=None, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’,sort_remaining=True)上述方法中常用参数:axis:轴索引(排序的方向原创 2020-11-15 14:53:20 · 21786 阅读 · 2 评论 -
Pandas索引操作及高级索引——reindex()方法
文章目录索引对象多个数据结构之间共享index类对象is与==的区别重置索引——reindex()索引操作Series的索引操作切片不连续索引布尔型索引DataFrame的索引操作获取不连续的Series对象切片Pandas库中的操作索引方法索引对象Index类对象,该对象不可以进行修改(不可变性),以保证数据的安全。多个数据结构之间共享index类对象基于Index类对象的不可变性,实现两个以上数据结构共享一个索引import pandas as pdimport numpy as np原创 2020-11-14 20:24:51 · 2537 阅读 · 0 评论 -
搞清axis的含义,这一篇就够了!
文章目录axis的含义旁门左道式理解二维数组中的axis三维数组中的axis正规理解axis的含义在自己分析之前先摆上官方关于多维数组中axis的值的定义:axis = 0,表示第一个维度axis = 1,表示第二个维度axis = -1,表示最后一个维度 【二维数组里axis=1和axis=-1等价】以下先分析二维数组里axis=1和axis=0的区别,再分析三维数组里axis=-1,0,1的区别PS:可以尝试先看看正规理解,如果能理解就不用看旁门左道式理解了~旁门左道式理解二维数原创 2020-11-14 14:33:30 · 19872 阅读 · 0 评论 -
Numpy实现酒鬼漫步问题【以及randint()、where()、cumsum()、argmax()的用法详解】
文章目录题目描述代码实现关于本题涉及到的几个函数randint()where()cumsum()题目拓展题目描述代码实现题目拓展题目描述代码实现argmax()题目描述从前有一个酒鬼,喝醉了行走在一条直线上,每走一步方向是不确定的(向前或者向后),当他走了2000步后,试求终点距离原点的距离。代码实现# 酒鬼走了2000步,终点和原点的距离step = 2000draw = np.random.randint(0, 2, size=step) # 随机生成2000步direction_s原创 2020-11-12 12:07:50 · 2873 阅读 · 1 评论 -
数组的转置和轴对称
文章目录T属性transpose()方法swapaxes()方法T属性import numpy as np # Numpy工具包data = np.arange(12).reshape(3, 4) # 创建一个3行4列的数组print(data)# 数组的转置和轴对称data1 = data.Tprint(data1)print(data)[[ 0 1 2 3][ 4 5 6 7][ 8 9 10 11]]print(data1)[[ 0 4原创 2020-11-03 23:33:55 · 1189 阅读 · 1 评论 -
Numpy数组的广播机制
文章目录前言数组广播广播机制的使用条件前言Numpy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作(矢量化运算)。当两个数组大小(Numpy.shape)不同时,进行算术运算会出现广播机制。数组广播数组在进行矢量化运算的时,要求数组形状时相等的。当形状不等的数组执行算术运算的时候,就会出现广播机制,该机制会对数组进行扩展,使数组的shape属性值一样,就可以进行矢量化运算了。import numpy as nparr1 = np.array([[0], [1], [2], [3]])原创 2020-11-02 09:49:23 · 830 阅读 · 0 评论 -
ndarray对象的建立
文章目录ndarray(别名array)常用属性创建NumPy数组使用array()函数ndarray(别名array)常用属性import numpy as np # Numpy工具包data = np.arange(12).reshape(3, 4) # 创建一个3行4列的数组print(data)print(type(data)) # 查看数组类型,输出结果<class 'numpy.ndarray'>print(data.ndim) # 数组维度的个数,2表二维原创 2020-10-31 18:54:38 · 1872 阅读 · 0 评论