《Python数据分析》学习记录001：2.2.1 pandas筛选行中满足某个条件的值， ‘.astype（float）’花样报错！

最新推荐文章于 2022-04-10 07:54:38 发布

「已注销」

最新推荐文章于 2022-04-10 07:54:38 发布

阅读量828

点赞数 3

分类专栏：读书笔记文章标签： python 数据分析字符串

本文链接：https://blog.csdn.net/Haoyu_xie/article/details/106562665

版权

在《Python数据分析》一书中，作者遇到在筛选Supplier Name包含Z或Cost大于600.0时，由于Cost列包含美元符号和逗号，导致astype(float)报错。通过replace()方法去除美元符号和逗号后，成功转换并筛选出符合条件的行。最终代码实现了预期的筛选功能。

摘要由CSDN通过智能技术生成

书中第二章，2.2.1小节，用pandas模块筛选Supplier Name列中名字包含Z，或者Cost列中值大于600.0的所有列。
csv文件中，Cost（成本列）的单位是美元，前面有一个美元符号‘$’，在excel中是货币形式，也就是大于千位的，会用‘，’进行分隔。所以，要想办法将Cost列的文本转化为浮点型数值才能跟600.0进行比较。问题也就出在这里，下面先列出问题：

问题展示：

按照书中给的代码，完整的敲下来是这样的：

import pandas as pd

file1 = 'supplier_data.csv'
file2 = 'output_file.csv'
data_frame = pd.read_csv(file1)
data_frame['Cost'] = data_frame['Cost'].str.strip('$').astype(float)
pandas3 = data_frame.loc[(data_frame['Supplier Name'].str.contains('Z')) | (data_frame['Cost'] > 600.0), :]
pandas3.to_csv(file2, index = False)

运行结果：

巴拉巴拉一堆之后：
Valu

最低0.47元/天解锁文章

「已注销」

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《Python数据分析》学习记录001：2.2.1 pandas筛选行中满足某个条件的值， ‘.astype（float）’花样报错！

书中第二章，2.2.1小节，用pandas模块筛选Supplier Name列中名字包含Z，或者Cost列中值大于600.0的所有列。csv文件中，Cost（成本列）的单位是美元，前面有一个美元符号‘$’，在excel中是货币形式，也就是大于千位的，会用‘，’进行分隔。所以，要想办法将Cost列的文本转化为浮点型数值才能跟600.0进行比较。问题也就出在这里，下面先列出问题：问题展示：按照书中给的代码，完整的敲下来是这样的：import pandas as pdfile1 = 'supplier
复制链接

扫一扫