系列文章目录
提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
例如:第一章 Python 机器学习入门之pandas的使用
提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
主要对于字符处理相关方法的展示:
字符串查询:find、rfind、index、rindex
字符串对齐:center、ljust、rjust、zfill
字符分割:split、splitlines和partition
字符串查询:
find(str, beg=0, end=len(string):
查找子串 str第一次出现的位置,返回查找到的索引,否则返回 -1
string, str = wait you name, name
print (string,find(str,2) # 9 在字符串 第二个位置查,返回整个字符串在获取这个字符前的那逐个字符索引
index(str, beg=0, end=len(string)):
查找子串 str第一次出现的位置,返回查找到的索引,否则抛出异常
字符串对齐:
center(width, fillchar):
返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
字符分割: split
https://so.csdn.net/so/search?q=split&spm=1001.2101.3001.7020str.split(seq="," ,num=string.count(str)):
关键字seq,num:将字符串 str用 seq的值分割(默认是空格),num为分割次数返回被分割字符串的列表
rsplit:与split类似,不过是从右边开始分割
splitlines:按照行进行分割,得到新的列表
partition(str):找到字符串中第一个str,并以str为界,将字符串分割为3部分,返回一个新的元组
rpartition(str):反向找字符串中第一个str,并以str为界,将字符串分割为3部分,返回一个新的元组
字符链接和替换:join,replace
str.join(seq):以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
filePath = os.path.join(sys.path[0], "dir", "filename") # 用于将程序路径和配置文件相对路径进行拼接
replace(old, new [, max]):把 将字符串中的 old 替换成 new,如果 max 指定,则替换不超过 max 次
判断字符规范性:
变量所属类型:type()、isinstance()、__class__
type(Variable)、Vriable.__class__:返回变量所属类型
isinstance(y,(int,dict,list):判断变量是否是所属类型中的一种,返回是 bool类型
方法名称 | 描述 |
isidentifier | 判断字符串是不是合法标识符(字符、数字、下划线) |
isspace | 判断字符是否只有空白字符 (回车、换行和水平制表符) |
isalpha | 判断字符串是否全部由字母组成 |
isdecimal | 判断字符是否全部由十进制的数字组成,不包括中文、罗马字符 |
isdigit | 判断字符串只包含数字,不包括中文数字 |
isnumeric | 判断字符串是否全部由数字组成,中文数字也算 |
isalnum | 判断字符串是否由字母和数字组成 |
islower | 判断字符串中的字符是否全部为小写,字符串至少有一个字符 |
isupper | 判断字符串中的字符是否全部为大写,字符串至少有一个字符 |
isprintable | 如果所有字符都是可打印的,则 isprintable() 方法返回 True,否则返回 False。 |
isascii | 如果字符串为空或字符串中的所有字符都是 ASCII,则返回 True,否则返回 False。 |
字符串剔除字符处理:
string.strip(str):将字符串前后缀为 str的字符消除,默认是空白字符
lstrip(str):以消除前缀的 str字符
rstrip(str):以消除前缀的 str字符
string.replase(" ",""):会消除字符串 string中所有空格字符
判断开头结尾字符串(startswith,endswith):
startswith(str):检查字符串是否以str开头,若是则返回true
endswith(str):检查字符串是否以str结尾,若是则返回true
字符串计数(count,len):
count(sub, start= 0,end=len(string)):在字符串[start,end)范围内,计算sub字符串的个数
len(string):len不是string的方法,是内置函数,计算字符串中的字符个数
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_contex
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。