利用python进行数据分析随笔小记

移除重复数据:

  DataFrame中常常出现重复行。比如下面这里例子:

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行.

这里还有一个与此相关的drop_duplicates方法,它用于返回一个移除了重复行的DataFrame:

DataFrame的drop_duplicates方法会判断全部列,你也可以指定部分列进行重复性判断:




print data['Date']
print data.iloc[2]    #按行号取第三行
print data.iloc[:, [1]]  #按列号取第二列
print data.ix[100]       #按行号取第101print data.ix['abc']     #取行名为abc的行
print data['Cost']       #取列名为Cost的列



data = [[1, 2, 3], [4, 5, 6]]
index = ['d', 'e']
columns = ['a', 'b', 'c']
df = pd.DataFrame(data=data, index=index, columns=columns)
print df
print df.loc['e', :'a']
print df.iloc[:1, :2]   #第一行的第一二列
print df.iloc[1, [1, 2]] #第一行的第二三列
print df.iloc[1]
print df.iloc[:, 2]      #取第三列
print df.loc['e', :]    #取行名为e的一整列

 
iloc是用行列号取数据,loc是用行列索引名字取数据


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值