map函数格式为:map(function, iterable, ...)
function:函数,含有两参数
iterable:一个或多个序列
function函数可以自己创建,之前使用的是将csv文件内的内容替换,例如将‘是’替换成‘yes’,将一些中文替换成数字表示等。
iterable:一般是list,可以多个一起按照function函数进行映射。
ps:注意一些python版本问题的小改变:python2返回的是列表,python3返回的是迭代器。
代码如下:
import pandas as pd
path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv'
#将数据中的中文含义用数据表示
def change_the_data(path):
df = pd.read_csv(path)
label_list = df['类别'] #存入类别标签
label_list = map(lambda x:[x,'yes'][x=='是'],label_list)
label_list = map(lambda x:[x,'no'][x=='否'],label_list)
print(list(label_list))
change_the_data(path)
csv文件类别标签打印出来为:
0 否
1 否
2 是
3 是
4 否
5 否
6 否
7 是
8 是
9 是
10 是
11 是
12 是
13 是
14 否
经过两次map转换后为:['no', 'no', 'yes', 'yes', 'no', 'no', 'no', 'yes', 'yes', 'yes', 'yes', 'yes', 'yes', 'yes', 'no']
匿名函数:lambda 格式为:lambda [arg1 [,arg2,.....argn]]:expression
冒号左边→想要传递的参数
冒号右边→想要得到的数(可能带表达式)