pandas 使用技巧


# 根据定好的columns去给数据集填值
# 数据集中与定好的columns中匹配的保留,缺失的根据fill_value的值进行填充,多余的忽略
a = pd.DataFrame({'haha': range(5), 'didi':range(20, 5), 'cc': range(40, 5)})
t_col = ['haha', 'fafa', 'didi', 'gg']
a.reindex(columns=t_col, fill_value=0)
输出:
	index haha	fafa	didi	gg
	0	0	0	20	0
	1	1	0	21	0
	2	2	0	22	0
	3	3	0	23	0
	4	4	0	24	0
	5	5	0	25	0

one-hot转类别值
[np.argmax(one_hot) for one_hot in y_predict]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas 是一个开源的数据分析工具库,提供了丰富而强大的操作技巧,下面将介绍一些常用的 pandas 操作技巧。 1. 数据读取与写入:使用 pandas 可以方便地读取和写入不同格式的数据文件,如 CSV、Excel、数据库等。只需使用对应的读取函数(如 read_csv()、read_excel())和写入函数(如 to_csv()、to_excel())即可。 2. 数据清洗与处理:pandas 提供了丰富的数据处理功能,如处理缺失值、重复值、异常值等。处理缺失值可以使用 dropna() 删除包含缺失值的行或列,使用 fillna() 填充缺失值;处理重复值可以使用 duplicated() 判断是否重复,再使用 drop_duplicates() 删除重复值;处理异常值可以使用条件判断或使用正则表达式等方法。 3. 数据选择与切片:pandas 可以灵活地选择和切片数据,使得数据的访问和操作更加简便。可以使用 loc[] 和 iloc[] 选择指定行或列,也可以使用条件判断选择特定条件下的数据。 4. 数据合并与拼接:pandas 提供了多种方式实现数据的合并和拼接操作,如使用 merge() 按照指定的键进行合并,使用 concat() 进行行或列的拼接,使用 join() 进行索引的连接等。 5. 数据分组与聚合:pandas 可以根据指定的条件进行数据分组,并进行聚合操作,如求和、求均值、求最大值等。可以使用 groupby() 对数据进行分组,再使用 agg()、sum()、mean() 等函数进行聚合运算。 6. 数据可视化:pandas 也提供了简单而强大的数据可视化功能,通过 DataFrame 的 plot() 方法可以直接绘制各种图表,如折线图、柱状图、散点图等。 以上是一些常用的 pandas 操作技巧,掌握这些技巧可以更加高效地进行数据处理和分析。当然,这仅仅是 pandas 的冰山一角,还有很多其他的功能和用法可以进一步探索和学习。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值