![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
文章平均质量分 74
python数据分析学习阶段,为机器学习打基础
Bumblebee972
这个作者很懒,什么都没留下…
展开
-
Pandas进阶
1、数据转换 1、apply,applymap应用 apply对DataFrame中的某一Series进行操作,上例中将Python中的成绩统一加100,使用的是简单隐式函数。 applymap是DataFrame中专有的,可以同时计算DataFrame中的每一个元素。 applymap可以同时将DataFrame中的所有数据进行操作。 2、transform使用 1、对一列执行一种操作 2、对一列执行多种操作 3、对多列执行不同操作 3、重排随机抽样哑变量 ...原创 2022-02-28 13:45:21 · 1371 阅读 · 0 评论 -
Pandas高级
1、数据筛选-赋值操作 在原有数据基础上增添一列。 将Python这一列的成绩统一增加十分: 将索引为2的同学的Math成绩改为100分: 想要批量修改多个数据时,将索引为2,4的Python和EN成绩改为100 当想要获取更多的数据的时候,就需要将索引和切片配合使用。 2、数据集成 1、concat数据串联 将1班和班的成绩合并在一起 pd.concat将df1和df2的数据合并在一起,默认行合并。 现在将df3和df1合并在一起。 将df1和...原创 2022-02-26 21:43:22 · 887 阅读 · 0 评论 -
Pandas初级
一、数据结构 1、一维结构 Series创建一维的结构,data后为数据,index后为索引,索引可以使用列表,当不指定索引时,默认为数字从0开始排序。 不指定索引index为默认索引。 2、二维结构 DataFrame创建二维结构,data创建一个二维的数组,index创建行索引,columns创建列索引。 创建出来的表格和Excel类似,有行索引,有列索引。 上面创建行列索引是通过列表创建,我们可以通过字典来创建DataFrame。 创建DataFrame的第二种..原创 2022-02-25 11:12:11 · 817 阅读 · 2 评论 -
Numpy高级
索引切片 对于二维数组的索引切片,需要将索引和切片配合使用。 一、形状改变 1、reshape数组重塑 reshape将数组形状重塑,从三行五列变为五行三列,其中数组中的元素依次后移。如原来三行五列中的第一行的元素2重塑后变为第二行的元素。 还有一种重塑方法用-1表示最后算,换句话来说如果设定reshap(-1,15)就会自动生成一行,reshape(-1,5)就会自动生成三行五列,但是要注意能够和原始数组对应起来,15个元素无法重塑为三行六列这一类。 2、concatenate..原创 2022-02-23 21:23:04 · 582 阅读 · 1 评论 -
Numpy初阶
一、numpy数组创建 Numpy数组是python中的一种开源数值计算扩展,不同于python中的列表,numpy可以用来储存和处理大型矩阵。 创建数组最简单的方法是使用array函数,将python中的list转化为数组。 我们也可以利用numpy中的内置函数来创建数组,示例如下: 1、内置函数ones创建全为1的数组: 开头import numpy as np 是将numpy包进行导入,shape = 10表示生成10个数。 2、内置函数zeros创建全为0的数组:原创 2022-02-23 12:25:56 · 3846 阅读 · 2 评论