Python:DataFrame 处理数据的常用函数

读取部分数据

df = pd.read_csv('demo.csv',nrows=1000,usecols=['column1', 'column2', 'column3'])

缓存数据

df.to_csv('Cache/cache_demo.csv', index=False)

添加一列

df['Score'] = scoreList

遍历 DataFrame

for index, row in df.iterrows():
    print(index) # 输出每行的索引值
    print(row) # 输出每行的内容

统计重复次数

df['列名'].value_counts()

统计不同的值

df['列名'].unique()

按照某一列排序

df.sort_values(by="列名")

数值化

# 数据预处理,对分类进行 id 转换,cat_id: 0——fake;1——ncw;2——real
df['cat_id'] = df['cat'].factorize()[0]
cat_id_df = df[['cat', 'cat_id']].drop_duplicates().sort_values('cat_id').reset_index(drop=True)
# cat 与 id 的转换字典
cat_to_id = dict(cat_id_df.values)
id_to_cat = dict(cat_id_df[['cat_id', 'cat']].values)
print("分类-id转换:\n", cat_id_df)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值