pandas是做数据分析的一个非常方便的工具,但是在使用过程中经常需要百度一些命令或者操作,很麻烦。现在打算按照官方文档整理一份完整的pandas手册出来,方便系统记忆和查询。
基本结构
DataFrame 是一个二维的数据表结构,大小可变,其元素的数据类型可以不一致,且带有行和列标签。
DataFrame([data, index, columns, dtype, copy]),以下将DataFrame缩写为df。
基本属性
Axes(轴属性),可理解行和列的基本属性。
df.index 返回df的索引,即行标签
df.columns 返回df的列名,即列标签
df.dtypes 返回每一列的数据类型
df.ftypes 返回每一列的数据类型,且标示该列的元素是稀疏还是密集
df.get_dtype_counts() 返回每个唯一数据类型的列数
df.get_ftype_counts() 返回每个唯一数据类型的列数,且标示出该数据类型对应的元素是稀疏还是密集
df.select_dtypes([include, exclude]) 可以从df中筛选某几个数据类型的子集,可以使用include(包含)或exclude(排除)操作
df.values 将DataFrame格式的数据转换成numpy.ndarray表示
未完待续……
博客留言查看不及时,如有问题的话,可以通过提问码向我提问,我会及时在微信收到。
点击链接http://www.letswen.com/s/15634181663496170601识别小程序二维码可直接向我提问,或扫描下面小程序码: