python_pandas的使用技巧

本文介绍了Python Pandas库的一些高级使用技巧,包括从大数据集中获取样本数据、dataframe的行列转换、检查None值、节省内存的数据类型转换、分类合并、插入新列、多重聚合、值类型变换以及选择特定数据等。
摘要由CSDN通过智能技术生成

1、从大数据集中获取样本数据

train_data = pd.read_csv('./titanic/train.csv', skiprows= lambda x: x>0 and np.random.rand() > 0.01)

2、dataframe的行列转换

d = {\
"zip_code": [12345, 56789, 101112, 131415],
"factory": [100, 400, 500, 600],
"warehouse": [200, 300, 400, 500],
"retail": [1, 2, 3, 4]
}
df = pd.DataFrame(d)
print(df)
df = df.melt(id_vars='zip_code', value_name= 'name', var_name='value')
print(df)
    zip_code	factory	warehouse	retail
0	12345	100	200	1
1	56789	400	300	2
2	101112	500	400	3
3	131415	600	500	4

zip_code      value  name
0      12345    factory   100
1      56789    factory   400
2     101112    factory   500
3     131415    factory   600
4      12345  warehouse   200
5      56789  warehouse   300
6     101112  warehouse   400
7     131415  warehouse   500
8     
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值