pandas
白衣法师甘道夫
这个作者很懒,什么都没留下…
展开
-
数据规整:层次化索引、合并、重塑
pandas的数据规整包含三个方面的内容:1.层次化索引;2.数据集合并;3.重塑。1 层次化索引在一个轴上拥有多个索引,能以低纬度处理高纬度问题;)层次化索引的赋值:data=pd.Series(np.random.randn(4),index=[['a','a','b','b'],[1,2,1,3]]))层次化索引的子集提取:data['b'] # 外层索引提取data...原创 2019-10-15 18:10:28 · 267 阅读 · 0 评论 -
pandas数据预处理初探:数据清洗、整备
本章节主要包含两个内容:1.缺失数据处理;2.数据转换(数值和字符串)。1.缺失数据处理)在pandas中,缺失数据以浮点值NaN表示,可以利用函数 data.isnull() 来判断,返回值为布尔型;)滤除缺失数据:data.dropna( ) # == data[data.notnull( )];dropna() 默认丢弃任何含有缺失值的行;dropna(how=‘all’)...原创 2019-10-12 17:41:40 · 280 阅读 · 0 评论 -
DataFrame结构数组的index索引顺序改变
在DataFrame的数组中,有时需要改变行的顺序,即index顺序的改变:df=pd.……order=[……]1)df.index=order # 仅仅改变索引的名称,原始数组的每行元素值并 没有 随之改变;2)df.take(order) # df的行索引按照 order 的顺序排列,且对应行的数组元素 随之重排;(行整体排序)3)df.iloc[order,:] # df 的行索引...原创 2019-09-09 13:54:57 · 2879 阅读 · 0 评论