python爬虫表格中清除空格_Pandas中如何去掉空格

本文详细介绍了在Python的Pandas库中如何处理数据表中的空格。首先通过创建数据表展示了数据格式,然后使用strip()方法去除B列字符串的首尾空格,接着使用replace()函数配合正则表达式全局替换所有空格,实现对整个数据表的空格清理。这些方法对于数据预处理和清洗非常实用。
摘要由CSDN通过智能技术生成

一、创建数据表

执行:

import pandas as pd

a = pd.DataFrame([['1qw',' 2e rt ','3uio'],['6qw ','7ert',' 8u io']],columns=list('ABC'))

输出表格如下:

98f758318ae43b02c03f163878a9e831.png

从表格中只能看到字符串中间的空格,两侧的空格无法判断是否存在,因此我们可以用代码 print(a.values )来查看单元格中具体的值是怎么样的,输出值如下:

[[‘1qw’ ’ 2e rt ’ ‘3uio’]

[‘6qw ’ ‘7ert’ ’ 8u io’]]

二、去空格操作

1、按位置去空格

strip()方法,去除字符串开头和者结尾的空格,lstrip()及rstrip()分别是去除字符串开头或者结尾的空格,即可去掉B列中所有单元格首尾空格,如下:

执行:

a['B'] = a['B'].str.strip()

print(a.values)

输出:

[[‘1qw’ ‘2e rt’ ‘3uio’]

[‘6qw ’ ‘7ert’ ’ 8u io’]]

其中’2e rt’中的前后空格都成功去掉,注意*a[‘B’] =*这部分是将已去掉空格的字符串替换原表中的字符串,若不重写原表中的值不会变化,即仍旧是未去掉空格的字符串。

2、去掉全部空格

replace()可以去掉字符串中包括夹在中间的所有空格,如下,对整张pandas表a进行去空格操作:

执行:

a.replace('\s+','',regex=True,inplace=True)

print(a.values)

输出:

[[‘1qw’ ‘2ert’ ‘3uio’]

[‘6qw’ ‘7ert’ ‘8uio’]]

通过输出可以看出表格中所有单元格的空格全部去掉了。

原文链接:https://blog.csdn.net/weixin_44665327/article/details/108293547

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值