自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 python数据规整化基础

这部分的数据规整化主要包括合并、重塑以及转化,其中的转换又包括清理。合并数据集pandas对象中的数据通过一些内置方法进行合并,pandas.merge可以根据一个或多个键将不同DataFrame中的行连接起来;pandas.concat可以沿着一条轴将多个对象堆叠到一起;实例方法combine_first可以将重复数据编接在一起,用一个对象中的值填充另一个对象中的缺失值。默认键连接...

2019-04-04 14:35:12 279

原创 Pandas基础篇

Pandas是基于NumPy构建的,让以NumPy为中心的应用变得更加简单。Pandas的数据结构主要有两个:Series和DataFrame。SeriesSeries是一种类似于一维数组的对象,它由数据和索引两部分构成,你可以把它理解成一种字典,同时它可以由字典创建而来。索引在左边,值在右边。如果没有指定索引,那么它的索引默认从0开始。我们可以分别用index和values来输出索引...

2019-04-02 23:55:07 194

原创 NumPy进阶篇

NumPy数据类型体系前面我们说过用dtype来指定数据的类型,有时我们会查看一个数组是属于哪一类,我们可以利用np.issubdtype函数来查看这个值是否属于这一类,而且还可以利用mro方法来查看其所有父类。test = np.ones(5,dtype=np.int32)print(np.issubdtype(test.dtype,np.signedinteger))print(...

2019-04-01 21:09:27 627

原创 NumPy基础篇

python的一个比较大的功能就是数据处理,我们耳熟能详三个工具包分别是NumPy、Pandas以及Matplotlib,其中NumPy用于提供高级的数值编程以及复杂的数据处理任务;Pandas用于数据读取以及数据预处理等工作;Matplotlib用于绘图,完成可视化的工作。我们现在从NumPy开始,介绍这几个工具的基本用法。NumPy的ndarray:一种多维数组对象NumPy最重要...

2019-04-01 14:23:01 386

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除