学习中遇到导入的表格中字符前后空格较多,直接用df.str.trip()报错,应该计是需要用循环遍历每个元素,本着偷懒原则一个语句直接解决问题。百度一番没找到合适的结果,可能是大家都没有这种低级问题吧,在外网只找到一个语句没有解释,试验后可行,记录一下
data1=pd.read_csv(r'test222.csv')
print(data1.head())
看下导入的表内容
导入表格发现字符串前后多次出现空格,考虑用函数将字符串分割(by各字符)后再拼接回来,这样空字符就消失了。但需要作用到dataframe的每个元素,用applymap()
##如果是series用map()
data1=data1.applymap((lambda x:"".join(x.split()) if type(x) is str else x))
split用空字符将字符串分割后用join链接回来, 加个判断 str 以防作用到 int 列时报错。
看下结果如何
print(data1)
Dataframe中所有字符串中的空格已去除,需要注意的是如果是英文句子,使用这个方法原字符串是英文句子的话中间的空格也会被去掉。