在 Python 的 pandas 库中,.map()
函数是一个用于将一个函数或者一个字典映射应用于一个 Series 的每个元素的方法。这个方法会对 Series 中的每个值执行一个指定的操作,并返回一个新 Series,其中包含应用函数后的结果。
以下是 .map()
函数的一些常见用途:
-
应用函数:你可以传递一个函数作为参数,
.map()
会将这个函数应用到 Series 的每个值上。df['column_name'] = df['column_name'].map(function)
-
替换值:使用字典进行值替换,字典的键是原始值,字典的值是替换后的值。
df['column_name'] = df['column_name'].map({original_value: new_value})
-
清洗数据:例如,去除字符串两端的空格或转换大小写。
df['column_name'] = df['column_name'].map(str.strip) df['column_name'] = df['column_name'].map(str.title)
-
类型转换:将 Series 中的值转换为不同的数据类型。
df['column_name'] = df['column_name'].map(int)
-
复杂的数据转换:
.map()
可以处理更复杂的数据转换逻辑,尤其是当你需要根据多个条件进行不同的操作时。
.map()
方法非常灵活,它可以大大简化数据处理和清洗的工作。需要注意的是,.map()
只能用于 Series 对象,如果你需要对整个 DataFrame 中的多个列应用相同的操作,你可能需要使用 .apply()
方法。