前言:python数据分析的基础知识,简单总结,主要是为了方便自己写的时候查看(你们可能看不太清楚T^T),发现有用的方法,随时补充,欢迎指正数据分析专栏:
python基础
1、三种基本数据类型
1.1列表
基础形式
表示:List=[1,2,3]
索引:List[0]=1;List[:1]=[1,2];List[-1]=3
常用函数
1、append添加一个元素
List.append(2)
2、insert插入
List.insert(1,2)在索引为1的位置增加2
3、remove删除
List.remove(1)删除元素1
4、count计数
List.count(1)输出1出现的次数
5、index位置索引
List.index(1)输出1的位置
6、reverse倒序
List.reverse()倒序输出
7、sort排序
List.sort(reverse=True)降序输出
List.sort(reverse=False)升序输出
1.2元组
cell=(1,2,3)--->不可像列表一样更改,索引等方法与列表类似
1.3字典
基础形式
dict={'name'='Tom','age'='13'}
以键名进行索引,没有像列表一样的排序,可以认为是无序的
dict['name']=Tom
常用函数
1、增加、修改
其实增加和修改有很多方式,我这里主要讲两种方式:
通过键直接修改、增加
dict['sex']='male'//如果存在sex就修改,不存在就增加
update函数
dict.update({'name'='Try'})//一样,如果存在name就修改,不存在就增加
2、get获得键值
dict.get('name')
3、dict.keys()输出所有的键
4、dict.values()输出所有的值
5、dict.items()输出所有键值对
#字典没有直接统计函数,可以用for循环+get统计,或者转换为df
2、判断、循环
- if语句
if a>1:(无括号)
****
elif a<0:
****
else:
****
- while语句
while ****:(无括号)
******
- for语句
for i in range(1,6):(无括号)
******
for i in List:
******
3、字符串
3.1常用函数
1、str[start:end:step]切片
2、split分割
str='Try is so handsome'
str.split('i')---->['Try ','s so handsome']
3、join拼接
'-'.join('Try')---->T-r-y
4、count计数
str.count('t')输出t出现的次数
5、删除空白strip、lstrip、rstrip
str.strip()删除首尾空白
6、index索引位置
str.index('t')输出t的位置,可能会报错
7、find找寻字串,不会报错(推荐使用)
如果包含子字符串返回开始的索引值,否则返回-1
8、统计字符串字母、数字的个数
s=input("please inupt string")
print(s.isdigit()) #用isdigit函数判断是否数字
print(s.isalpha()) #isalpha判断是否字母
print(not (s.isalpha() or s.isdigit()) and s.isalnum()) #isalnum判断是否数字和字母的组合
3.2正则表达式
符号 | 含义 |
---|---|
. | 匹配任意字符串,除了\n |
| | 转义符,保留字符串中的特殊元字符 |
[ ] | 字符组 |
\d | 匹配任意数字 |
\s | 匹配空白字符 |
\w | 匹配字母和下划线 |
* | 匹配前一个字符组0到无穷 |
+ | 匹配前一个字符组1到无穷 |
? | 匹配前一个字符组0到1 |
还有很多这里不一一列举!(正则表达式很重要)
补充:
1、findall函数
是找寻函数
re.findall()匹配的时候如果有括号,只能取到括号里面的内容,多个括号返回列表
2、search函数
re.search()函数将对整个字符串进行搜索,并返回第一个匹配的字符串的match对象
3、match函数
从头匹配,不匹配返回None
4、compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象
pattern = re.compile(r'\d+')
m = pattern.match('one12twothree34four')
【注】re.search()和re.match()函数返回match对象包括分组时,group(0)返回【完整匹配】的字符串,group(1)及以上分别返回各分组字符串。groups()函数返回各分组组成的元组对象
注:(.*?)匹配任意字符串
4、 函数
函数主要是参数的问题:
1、必选参数
必须要赋值的参数,否则调用函数报错
2、默认参数
函数已经赋值的参数,不可更改
3、可变参数
如add(*args)--->这里的*args就是可变参数,可以接受多个实参(如列表,可以简单的类似指针)
4、关键字参数
add(**kwargs)----->这个就是针对字典的,**kwargs既可以接受多个实参,还可以把多个实参指定各自的实参名(这不就是字典吗???!)