pandas处理数据一些技巧

1、统计某个值出现次数

df["category"].value_counts()
Loading necessary files...
10    20125
1      2686
0      1211
3       720
4       228
2       144
Name: category, dtype: int64

2、匹配两个文件中相同数据

buildFeatPath = r"./Dataset/train_nj_polyMark(newDensity)_0205.csv"
poi_onehot_path = r"./result/onehot_{}m.csv".format(radius)
df_poi = pd.read_csv(poi_onehot_path, sep=";", usecols=["build_id"])
# print(df_poi.shape)
df_build = pd.read_csv(buildFeatPath, sep=";")
# 匹配两个pandas数据的交集——inner
# http://bluewhale.cc/2016-08-15/python-merge.html
df_inner = pd.merge(df_poi, df_build, how="inner")

参考与:http://bluewhale.cc/2016-08-15/python-merge.html

3、pandas读取数据排序

# ascending:是否升序排序,默认为true,降序则为false
# "build_id"采用升序排列, "cate_two"采用降序排列
df = df_poi.sort_values(by=["build_id", "cate_two"], ascending=[True, False])
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值