Pandas
Pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量的库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量快速便捷地处理数据的函数和方法。
糖潮丽子
这个作者很懒,什么都没留下…
展开
-
Series 对象
Series基于NumPy的数组对象来的,和NumPy的数组不同的是,Series能为数据自定义标签,就是索引(index),然后通过索引来访问数组中的数据。1、创建Series对象并省略索引sel = Series([1,2,3,4])2、自己创建索引sel = Series(data = [1,2,3,4],index=['a','b','c','d'])sel = Series(...原创 2020-02-23 14:01:06 · 1038 阅读 · 0 评论 -
DataFrame处理空值&处理重复数据
过滤缺失数据 dropna()通过 dropna() 滤除缺失数据,凡是包含NaN的行/列都过滤掉:df1.dropna()传入how=‘all’ 滤除全部都是NaN的数据: df1.dropna(how='all')默认情况下是 how=‘any’,只要有NaN就删除 :df1.dropna(how='any')传入axis=1 或 axis=0 过滤列或者行的NaN:df1.d...原创 2020-02-23 13:36:14 · 1683 阅读 · 0 评论 -
DataFrame合并
DataFrame合并和删除原创 2020-02-22 18:25:21 · 736 阅读 · 0 评论 -
DataFrame添加数据
添加数据1、给数据框最后添加一列例如给如下数组添加一列:数组名为df1,给df1加score一列:df1['score']=[80,98,67,90]可以直接命名列名,赋值数据即可。注意:增加列的元素个数要跟原数据列的个数一样2、在具体某个位置插入一列可以用 insert 的方法df1.insert(iloc,column,value)iloc:要插入的位置colunm...原创 2020-02-21 23:08:04 · 36087 阅读 · 0 评论 -
Pandas 读取csv文件后对数据的基础操作(小练习)
数据源是一个北京的天气报告.csv文件(本文输出只展示文件的前六行内容)导入:import pandas as pd读取文件:data=pd.read_csv('./BJ_tianqi.csv') 查看文件前6行print(data.head(6))输出结果:改变数据行的索引 inplace=True在原来数据的基础上修改#将日期作为行索引data.set_index(...原创 2020-02-21 17:25:34 · 6131 阅读 · 0 评论 -
DataFrame获取数据
DataFrame获取数据1、获取行数和列数 shape除了索引和列名,查看数组中有几行几列2、获取行索引 index.tolist( )3、获取数据类型 dtypes4、获取内容 valuesvalues属性也会以二维ndarray的形式返回DataFrame的数据5、显示头几行,默认显示5行 head6、显示后几行 tail7、获取DataFrame的列获取某一列...原创 2020-02-20 20:36:53 · 5520 阅读 · 0 评论 -
DataFrame修改index索引和columns列名
DataFrame修改index索引和columns列名修改索引index1、采取直接赋值的方法:df1=pd.DataFrame(np.arange(9).reshape(3,3),index=['bj','sh','gz'],columns=['a','b','c'])print(df1)#修改index,直接给index重新赋值df1.index=['beijing','shan...原创 2020-02-20 16:21:15 · 12349 阅读 · 0 评论 -
DataFrame创建数据
DataFrame创建数据所需包/库:import pandas as pdimport numpy as npfrom pandas import DataFrame1、使用二维数组创建df1=DataFrame(np.random.randint(0,10,(4,4)),index=[1,2,3,4],columns=['a','b','c','d'])print(df1)''...原创 2020-02-20 13:39:38 · 3866 阅读 · 0 评论