自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 5.4处理缺失数据

对于一个Series, dropna返回一个仅含非空数据和索引值的Series。对于大多数情况而言,fillna方法是最主要的函数.通过一个常数调用fillna就会将缺失值替换为那个常数值。pandas使用浮点值NaN (Not a Number)表示浮点和非浮点数组中的缺失数据。给dropna传入how=' all ',将只丢弃全为NA的那些行。若是通过一个字典调用fillna,就可以实现对不同的列填充不同的值。fillna默认会返回新对象,但也可以对现有对象进行就地修改。

2023-05-26 15:33:58 37 1

原创 4.3利用数组进行数据处理

numpy.random模块对内置的random进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数。最常用的可能是np.unique,它用于找出数组中的唯一值并返回已排序的结果。如果cond中为true,我们取xarr中对应的值,否则就取yarr中的值。在上面这些方法中,布尔值会被强制转换为1 (True)和0 (False),因此,sum经常被用来对布尔型数组中的True值计数。用where的话会非常简单。顶级方法np.sort返回的是数组的已排序副本,而就地排序则会修改数组本身。

2023-05-03 21:18:35 46

原创 4.2通用函数

enumerate() :用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数。许多ufunc都是简单的元素级变体,如sqrt和exp。二元通用函数: 接受2个数组,并返回一个结果数组。使用sympy完成极限、导数、积分运算。一元通用函数,即接受一个数组。

2023-05-03 20:46:52 47

原创 4.1ndarry的计算和基本操作

linspace生成等间隔的数列,前两个参数是数列开始和结尾,第三个是数列中元素个数 eye是创建一个正方的N*N单位矩阵(对角线 为1,其余为0)向reshape传入一个表示新形状的元组(tuple),可将数组从一个形状转换为另一个形状有返回值,即不对原始多维数组进行修改。可以利用这种数组对整块数据执行一 些数学运算,其语法跟标量元素之间的运算一样。它接受一切序列型的对象,然后产生一个新的含有传入数据的NumPy。)称为轴(axes),轴的个数称为秩(rank)数组和标量之间的运算(应用到元素级)

2023-05-03 20:31:22 71

原创 5.3汇总和描述性统计

它们大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。有些方法(如idxmin和idxmax)返回的是间接统计(计算能够获取最小值或最大值的索引值) 还有一种方法,它既不是约简型也不是累计型。DataFrame的corr和cov方法将以DataFrame的形式返回完整的相关系数或协方差矩阵。Series的corr方法用于计算两个Series中重叠的、非NA的、按索引对齐的值的相关系数。与此类似,cov用于计算协方差。

2023-05-03 18:49:07 72

原创 5.2基本功能

DataFrame和Series之间的运算 跟NumPy数组一样,DataFrame和Series之间算术运算也是有明确规定的,先来看一个具有启发性的例子,计算一个二维数组与其某行之间的差,即广播。不同索引的对象进行算术运算 对象相加时,如果存在不同的索引对,则结果的索引就是该索引对的并集。在算术方法中填充值 在对不同索引的对象进行算术运算时,你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值(比如0。pandas对象的一个重要方法是reindex,其作用是创建一个适应新索引的新对象。

2023-05-02 21:51:06 38 1

原创 5.1pandas的数据结构

跟其他类似的数据结构相比(如R的data.frame) ,DataFrame中面向行和面向列的操作基本上是平衡的。一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。是一个表格型的数据结构,它含有一组有序的列,毎列可以是不同的值类型(数值、字符串、布尔值等)。如果赋值的是一个Series,就会精确匹配DataFrame的索引,所有的空位都将被填上缺失值。

2023-05-02 21:14:07 56 1

原创 4.5线性代数

mat.dot(inv(mat))生成的应该是单位阵,只不过在生成逆矩阵inv(mat)时,很多元素 是近似的浮点数,所以得到的也不是刚好的单位阵,而是近似的单位阵。dot既是一个数组方法也是numpy命名空间中的一个函数。1、内积运算(dot)

2023-05-02 19:40:08 54 1

原创 4.4用于数组的文件输入和输出

通过np.savez可以将多个数组保存到一个压缩文件中,将数组以关鍵字参数的形式传入即可。加载.npz文件时,会得到一个类似字典的对象,该对象会对各个数组进行延迟加载。

2023-05-02 16:52:51 59 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除