[Python学习之数据替换]
摘要:利用python进行字符串的批量替换
1.导入数据分析所需的库import pandas as pd
2.构造所需的测试数据集
data1 = pd.DataFrame({"a":['asw','fde','as'],
"b":['sad','def','jui'],
"c":['asw,fde','asw,gtfd','fde']})
3.具体的分析过程
# 构造原始数据以及新数据映射关系的字典
dict_country = data1.iloc[:,:-1].set_index('a').T.to_dict('list')
#以逗号分隔每行数据
data2 = data1['c'].str.split(",",expand = True)
#根据构造的字典进行字符串的替换
data3 = data2.replace(dict_country)
#进行字符串的合并
data4 = data3.apply(lambda s:";".join(filter(None,s)),axis = 1)
#添加处理好的数据
data1['d'] = data4
data1
转载本文请联系原作者获取授权,同时请注明本文来自李立科学网博客。
链接地址:http://blog.sciencenet.cn/blog-3262505-1137413.html
上一篇:python学习——根据条件提取数据,并去重
下一篇:python学习——算法练习1