前言
在数据分析过程中,有时需要先对数据进行格式转换,比如本案例中数字带有万、亿等单位,它实质上是一个字符串,无法参与统计计算,因此我们先要将它们转换为数字类型。一起来看看 pandas是如何操作的。
思路
- 可以写一个函数来处理,传入的是一个字符串,输出一个整型的数字,最后用一列的 map() 方法映射调用这个方法。
- 字符串中将万、亿分别替换为科学计数法的 e4 和 e8,形成了数字的科学计算法字面量,如字符串 5.90e8,然后用 Python
内置函数 eval() 来转换为 Python 对象,即数字类型。
使用步骤:
1.引入库
代码如下(示例):
from io import StringIO
import pandas as pd