pandas的问题总结

1、pandas读取文件时,read_table("txt",names=['','','']) names后面的是索引

2、pandas去除空白行 

删除表中全部为NaN的行
df.dropna(axis=0,how='all')  


3、pandas添加一列
只要df['x'] = y 添加一个索引就行
4、numpy查找最多值

count = np.bincount(everyfont)   #将出现次数最多的字体认为是正文
common_value = np.argmax(count)
 
5、numpy合并
np.append
6、标准化数据
sklearn.processing.MinmaxScare

7、pandas的onehot表示

keyword = pd.get_dummies(df['f1'])
 
8、如何替换numpy数组中的值
keyword_array[x] = np.array(['100']*9)
9、pandas统计某一列重复值
先转换为series,然后series.value_counts()会列出每一个值出现的次数


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值