《Python数据分析》学习记录001:2.2.1 pandas筛选行中满足某个条件的值, ‘.astype(float)’花样报错!

在《Python数据分析》一书中,作者遇到在筛选Supplier Name包含Z或Cost大于600.0时,由于Cost列包含美元符号和逗号,导致astype(float)报错。通过replace()方法去除美元符号和逗号后,成功转换并筛选出符合条件的行。最终代码实现了预期的筛选功能。
摘要由CSDN通过智能技术生成

书中第二章,2.2.1小节,用pandas模块筛选Supplier Name列中名字包含Z,或者Cost列中值大于600.0的所有列。
csv文件中,Cost(成本列)的单位是美元,前面有一个美元符号‘$’,在excel中是货币形式,也就是大于千位的,会用‘,’进行分隔。所以,要想办法将Cost列的文本转化为浮点型数值才能跟600.0进行比较。问题也就出在这里,下面先列出问题:

问题展示:

按照书中给的代码,完整的敲下来是这样的:

import pandas as pd

file1 = 'supplier_data.csv'
file2 = 'output_file.csv'
data_frame = pd.read_csv(file1)
data_frame['Cost'] = data_frame['Cost'].str.strip('$').astype(float)
pandas3 = data_frame.loc[(data_frame['Supplier Name'].str.contains('Z')) | (data_frame['Cost'] > 600.0), :]
pandas3.to_csv(file2, index = False)

运行结果:

巴拉巴拉一堆之后:
ValueError: coul
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值