一、创建数据表
执行:
import pandas as pd
a = pd.DataFrame([['1qw',' 2e rt ','3uio'],['6qw ','7ert',' 8u io']],columns=list('ABC'))
输出表格如下:
从表格中只能看到字符串中间的空格,两侧的空格无法判断是否存在,因此我们可以用代码 print(a.values )来查看单元格中具体的值是怎么样的,输出值如下:
[[‘1qw’ ’ 2e rt ’ ‘3uio’]
[‘6qw ’ ‘7ert’ ’ 8u io’]]
二、去空格操作
1、按位置去空格
strip()方法,去除字符串开头和者结尾的空格,lstrip()及rstrip()分别是去除字符串开头或者结尾的空格,即可去掉B列中所有单元格首尾空格,如下:
执行:
a['B'] = a['B'].str.strip()
print(a.values)
输出:
[[‘1qw’ ‘2e rt’ ‘3uio’]
[‘6qw ’ ‘7ert’ ’ 8u io’]]
其中’2e rt’中的前后空格都成功去掉,注意*a[‘B’] =*这部分是将已去掉空格的字符串替换原表中的字符串,若不重写原表中的值不会变化,即仍旧是未去掉空格的字符串。
2、去掉全部空格
replace()可以去掉字符串中包括夹在中间的所有空格,如下,对整张pandas表a进行去空格操作:
执行:
a.replace('\s+','',regex=True,inplace=True)
print(a.values)
输出:
[[‘1qw’ ‘2ert’ ‘3uio’]
[‘6qw’ ‘7ert’ ‘8uio’]]
通过输出可以看出表格中所有单元格的空格全部去掉了。