【感谢】王强朋友提供的建议。(评论者设置了不允许我回复,所以就在这里公开感谢一下)
pd.read_csv 有如下一个参数:
thousands : str, default None,这是一个千分位分割符读取。如果设置为','或'.',在读入csv文件时,会自动识别数据中的','或者'.',然后按照数字来处理。
例如如下的使用方法:
df = pd.read_csv('test.csv',thousands=',')
这种方法可以更简单解决我读取‘’金额‘’这个场景问题。
但是,本人并不认为本文所写的内容不能用在其他场合。
回复中那位嘲笑我被打脸的朋友,如果您每天都能提供有价值的建议,我也希望你能天天来打脸!
学无止境,打脸又如何!:-)
——————————————————————
今天遇到一个问题,导入某数据的时候,原始是金额数据,其中带有逗号(,),用read_csv()导入以后识别成object对象,无法直接按照数字处理,需要进行转换。如下所示。
网上一种方法是编写一个转换函数,而且需要做循环检查处理。
本人认为这样不可取。
- 第一,我认为如果有软件包函数能处理的情况下,尽可能不要自己去编造函数。效率可能不高,代码可能还更长。除非是认为自己编写的替代函数效率更高。
1.使用pd.DataFrame.replace()函数,失败。具体如下
1)显示一下数据
2)使用replace()函数,做行替换,设置替换逗号“,”(可生效,但无法作用整个DataFrame)
3)使用replace()函数,做全列查找替换,设置替换逗号“,”(没有替换成功,而且inplace也无效)
4)使用replace()函数,使用再赋值的办法,替换逗号“,”(还是无效)
2.使用pd.DataFrame.str.replace()函数,成功
1)使用str.replace()函数,使用inplace使其直接生效,替换逗号“,”(报错,此处不能使用inplace参数)
2)使用str.replace()函数,替换逗号“,”(可以生效,但是没有在原DataFrame中生效)
3)使用str.replace()函数,替换逗号“,”,同时使用再赋值的办法(生效)!!!
3.原因分析:
1)replace()是基于行数据的替换
2)str.replace()可以基于整个DataFrame做遍历替换
敲下黑板:能用简便方法的时候,别用自己编函数的办法。