- 博客(4)
- 收藏
- 关注
原创 python数据规整化基础
这部分的数据规整化主要包括合并、重塑以及转化,其中的转换又包括清理。合并数据集pandas对象中的数据通过一些内置方法进行合并,pandas.merge可以根据一个或多个键将不同DataFrame中的行连接起来;pandas.concat可以沿着一条轴将多个对象堆叠到一起;实例方法combine_first可以将重复数据编接在一起,用一个对象中的值填充另一个对象中的缺失值。默认键连接...
2019-04-04 14:35:12 309
原创 Pandas基础篇
Pandas是基于NumPy构建的,让以NumPy为中心的应用变得更加简单。Pandas的数据结构主要有两个:Series和DataFrame。SeriesSeries是一种类似于一维数组的对象,它由数据和索引两部分构成,你可以把它理解成一种字典,同时它可以由字典创建而来。索引在左边,值在右边。如果没有指定索引,那么它的索引默认从0开始。我们可以分别用index和values来输出索引...
2019-04-02 23:55:07 212
原创 NumPy进阶篇
NumPy数据类型体系前面我们说过用dtype来指定数据的类型,有时我们会查看一个数组是属于哪一类,我们可以利用np.issubdtype函数来查看这个值是否属于这一类,而且还可以利用mro方法来查看其所有父类。test = np.ones(5,dtype=np.int32)print(np.issubdtype(test.dtype,np.signedinteger))print(...
2019-04-01 21:09:27 667
原创 NumPy基础篇
python的一个比较大的功能就是数据处理,我们耳熟能详三个工具包分别是NumPy、Pandas以及Matplotlib,其中NumPy用于提供高级的数值编程以及复杂的数据处理任务;Pandas用于数据读取以及数据预处理等工作;Matplotlib用于绘图,完成可视化的工作。我们现在从NumPy开始,介绍这几个工具的基本用法。NumPy的ndarray:一种多维数组对象NumPy最重要...
2019-04-01 14:23:01 424
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人