公司给了一个TB某品类的市场调研任务,经过一番努力,搞了几十个数据报表,由于列名都是一致的,前期数据清洗进度很快。当进行数据分析的时候,总是频繁提示数据中带有逗号,用如下代码进行了清洗。
result["搜索人数"] = result.loc[:, "搜索人数"].apply(lambda x: float(x.replace(",", "")))
随着分析的深入,需要做算术运算,使用如下代码进行数据类型转化
result["搜索人数"].astype('float')
频繁部分列出现报错
AttributeError: 'int' object has no attribute 'replace'
你根本无法想象,搜索人数的单元格式,竟然是货币格式(查看源文件才发现)
result["搜索人数"