python怎么处理文字_其实Python不难学(4):Python如何处理文本数据

文本的处理是数据分析工作中很重要的业务领域。Python的字符串变量用于操纵文本型数据。以下命令就定义了一个字符串变量,用于存放一段文本资料。

在Python中,文本数据使用一对单引号或双引号来界定的,其定义方式非常简单。现在我们重点来学习对文本数据的常用操作。

1.连接操作

连接操作完成多个文本内容的拼接,使用“+”操作符。

2.截取操作

截取操作根据字符在文本中的位置提取文本数据的部分内容。比如提取product_name变量中第3个位置开始到第5个位置之前的内容,就可以写成

为什么结果不是“:苹”,而是“苹果”呢?原因是字符的位置(也叫下标)是从0开始计数的,这一点需要牢记。绝大多数编程语言都遵循这个计数规则。

如果我想提取第三个位置开始的所有内容,可以使用如下操作:

引申一下,如果我想提取第5个位置开始的所有内容,就使用如下操作:

如果我们把下标写成负数会怎样呢?

原来当下标为负数时,Python是从后向前进行定位提取的。这是Python很有特色的一种做法,能够满足我们逆向操作的特殊需要。

3.替换操作

替换操作可以使用新内容替换文本中的指定内容,如:

product_name字符串变量中的所有“苹果”字样被全部替换为"华为"。

4.计数操作

技术操作完成对文本内容的计数统计,如len()函数完成对所有字符数量的统计:

而count()函数则完成对指定内容的统计。

需要注意的是len()函数是Python的公共函数,而count()是字符串变量的函数,所以count()前面需要加变量名称。

5.查找操作

查找操作用来确定指定内容是否出现在一段文本中,如:

我们使用“in”操作符。操作符的前面是要查找的内容,后面是被查找的大段文本,位置不能写反。

“in”操作符的计算结果是逻辑型的,如果要查找的内容出现在被查找的文本中,结果是True,否则就是False。

6.定位操作

定位操作也是一种查找操作,但是它返回的是要查找内容在文本中的位置。如:

定位操作使用字符串变量的find()函数和rfind()函数,所以这两个函数在使用时前面要加上被缠找的字符串变量名称,并用小数点“.”隔开。如上例的product_name。find用于从前向后查找,rfind()是从后向前查找。如果找到内容,则返回第一次找到的起始位置,否则返回-1。

关注公众号interbigdata,轻松用Python做数据分析(主要面向非计算机专业,日常工作学习中需要进行数据分析的人士)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值