Python常用的字符处理方式

系列文章目录

提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
例如:第一章 Python 机器学习入门之pandas的使用


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

主要对于字符处理相关方法的展示:

字符串查询:find、rfind、index、rindex

字符串对齐:center、ljust、rjust、zfill 

字符分割:split、splitlines和partition


字符串查询:

find(str, beg=0, end=len(string):

        查找子串 str第一次出现的位置,返回查找到的索引,否则返回 -1

string, str = wait you name, name
print (string,find(str,2)        # 9 在字符串 第二个位置查,返回整个字符串在获取这个字符前的那逐个字符索引

index(str, beg=0, end=len(string)):

      查找子串 str第一次出现的位置,返回查找到的索引,否则抛出异常

字符串对齐:

center(width, fillchar):

        返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。

字符分割:        spliticon-default.png?t=N3I4https://so.csdn.net/so/search?q=split&spm=1001.2101.3001.7020str.split(seq="," ,num=string.count(str)):

关键字seq,num:将字符串 str用 seq的值分割(默认是空格),num为分割次数返回被分割字符串的列表

rsplit:与split类似,不过是从右边开始分割

splitlines:按照行进行分割,得到新的列表

partition(str):找到字符串中第一个str,并以str为界,将字符串分割为3部分,返回一个新的元组

rpartition(str):反向找字符串中第一个str,并以str为界,将字符串分割为3部分,返回一个新的元组

字符链接和替换:join,replace

str.join(seq):以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串

filePath = os.path.join(sys.path[0], "dir", "filename")    # 用于将程序路径和配置文件相对路径进行拼接

replace(old, new [, max]):把 将字符串中的 old 替换成 new,如果 max 指定,则替换不超过 max 次

判断字符规范性:

变量所属类型:type()、isinstance()、__class__

type(Variable)、Vriable.__class__:返回变量所属类型

isinstance(y,(int,dict,list):判断变量是否是所属类型中的一种,返回是 bool类型
方法名称描述
isidentifier判断字符串是不是合法标识符(字符、数字、下划线)
isspace判断字符是否只有空白字符(回车、换行和水平制表符)
isalpha判断字符串是否全部由字母组成
isdecimal判断字符是否全部由十进制的数字组成,不包括中文、罗马字符
isdigit判断字符串只包含数字,不包括中文数字
isnumeric判断字符串是否全部由数字组成,中文数字也算
isalnum判断字符串是否由字母和数字组成
islower判断字符串中的字符是否全部为小写,字符串至少有一个字符
isupper判断字符串中的字符是否全部为大写,字符串至少有一个字符
isprintable如果所有字符都是可打印的,则 isprintable() 方法返回 True,否则返回 False。
isascii

如果字符串为空或字符串中的所有字符都是 ASCII,则返回 True,否则返回 False。

 

字符串剔除字符处理:

string.strip(str):将字符串前后缀为 str的字符消除,默认是空白字符

lstrip(str):以消除前缀的 str字符

rstrip(str):以消除前缀的 str字符

string.replase(" ",""):会消除字符串 string中所有空格字符

判断开头结尾字符串(startswith,endswith):

startswith(str):检查字符串是否以str开头,若是则返回true

endswith(str):检查字符串是否以str结尾,若是则返回true

字符串计数(count,len):

count(sub, start= 0,end=len(string)):在字符串[start,end)范围内,计算sub字符串的个数

len(string):len不是string的方法,是内置函数,计算字符串中的字符个数

代码如下(示例):

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import  ssl
ssl._create_default_https_context = ssl._create_unverified_contex

2.读入数据

代码如下(示例):

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值