数据分析小白自学笔记
第一天
目录
大家好啊,暑假马上开始了,我一直都有想好好学习python来进行数据分析的想法,同时为了准备今年的国赛,我打算开展为期一个半月的python数据分析自学计划,每天都会打卡。每天学习的知识点中容易遗忘的我都会总结下来,方便自己查阅。
一、字符串常用函数及方法
1.spilt字符串分割函数
用split()方法可以把字符串按照指定分隔符进行分隔:
例如:
str4 = '今天,我上班没有摸鱼,而同事摸了一天,他用这种方式提高了自己的时薪'
print(str4)
#用split来分隔,括号内的参数表示按照什么来切分
print(str4.split(','))
输出结果:
今天,我上班没有摸鱼,而同事摸了一天,他用这种方式提高了自己的时薪
['今天', '我上班没有摸鱼', '而同事摸了一天', '他用这种方式提高了自己的时薪']
2.长度函数len
len()能够帮我们统计字符串的长度
Python里一个汉字、空格、字母、数字和符号,对应长度都是1,出现了几个则长度就是几:
print(len('今天')) #2个汉字,返回长度是2
print(len('today')) #5个字母,返回长度是5
print(len('今 t1。')) #汉字、空格、字母、数字、符号,返回长度是5
结果:
2
5
5
3.查找函数find和in关键字
因为这两个关键字都涉及到关于字符串查找,所以我在这里讲解和区分一下。
find
可以查询一个字符在字符串中首次出现的位置,类似字符串的匹配。
str5 = 'Hello'
print('字母o首次出现的位置:',str5.find('o'))
结果:
字母o首次出现的位置: 4
in
只能判断这个这个字符是否在字符串内,在返回True,不在返回False
结果:
print('o' in str5)
True
4.切片
切片是从目标中切出一部分数据的意思,字符串的切片,依然是用中括号加数字的方式:
不同的是,在括号中,有一个“:”的符号,这个符号用来连接两个数字,指代从哪个位置开始,到哪个位置前结束,是含首不含尾的原则:
str5='fagwewaaw'
print('用从左往右的方式,str5[:3] :',str5[:3])
print('用从右往左的方式,str5[1:4] :',str5[1:4])
结果:
用从左往右的方式,str5[:3] : fag
用从右往左的方式,str5[1:4] : agw
自己练习一下:
给定一个字符串’abcdef’,提取并打印其中的一部分:从第3个字符开始,到第6个字符结束(不包括第6个字符)。
str3='abcdef'
print(str3[2:5])
结果:
cde
5.替换函数 replace
替换简而言之就是用一段字符串或一个字符来替换一段长字符串的某部分。
replace主要有两个参数,第一个参数,表示原来字符串哪一部分需要被替换,第二个参数则代表要用什么内容来替换掉原来的部分
str6 = '数据不吹牛啊,不吹牛!'
print(str6)
print(str6.replace('不','绝不')) #把原字符串中的不,替换成了绝不
print(str6.replace('不','')) #把原来字符串中的不,替换成了空字符串,相当于删掉
结果:
数据不吹牛啊,不吹牛!
数据绝不吹牛啊,绝不吹牛!
数据吹牛啊,吹牛!
二、列表的常用函数
1.append末尾添加
向列表中增加元素,用的是append()函数,在列表末尾添加新的元素:
lst2 = ['阿粥'] #原列表只有一个元素
print(lst2) #输出一下看看
lst2.append('数据不吹牛') #添加了一个元素并打印
print(lst2)
lst2.append('Python') #又添加了一个元素
print(lst2)
['阿粥']
['阿粥', '数据不吹牛']
['阿粥', '数据不吹牛', 'Python']
2.insert指定位置添加
insert()函数能够在指定位置添加元素:
print(lst2) #原来的列表
#第一个参数表示在列表索引为1的位置插入,第二个参数表示插入的内容
lst2.insert(1,'小z')
print(lst2)
['阿粥', '数据不吹牛', 'Python']
['阿粥', '小z', '数据不吹牛', 'Python']
3.列表拓展
append和insert添加的是单个元素,如果要把两个列表合并,可以用extend:
lst3 = ['a','b','c','d']
print('原来的lst3:',lst3)
lst4 = ['5',123,'嘿嘿']
#用extend函数,把lst4合并进了lst3中,运行后lst3变成了合并后的结果
lst3.extend(lst4)
print('lst3和lst4两个列表合并:',lst3)
原来的lst3: ['a', 'b', 'c', 'd']
lst3和lst4两个列表合并: ['a', 'b', 'c', 'd', '5', 123, '嘿嘿']
4.删除函数pop和remove
有增必有删,若要删除,相对常用的有remove和pop两种方式,remove是按照内容来删除,pop则是根据位置:
lst5 = ['python','java','php','go']
#用remove删除了lst5中'python'这个元素
lst5.remove('python')
print(lst5)
#上一步删除后,'java'成了排名第一的语言,pop(0)表示直接删除了索引为0(位置排在第一个)的'java'
lst5.pop(0) #pop如果不带参数默认删除最后一个
print(lst5)
['java', 'php', 'go']
['php', 'go']
5.统计元素次数count函数
简而言之,统计元素出现的次数
lst6 = [1,1,1,3,4,5,6,1,1]
print('1在列表中出现了多少次:',lst6.count(1))
1在列表中出现了多少次: 5
6.排序函数sort
lst6 = [1,1,1,3,4,5,6,1,1]
lst6.sort() #如果不填任何参数,默认按照升序排列
print(lst6)
lst6.sort(reverse = True) #reverse = True,表示按照降序排列
print(lst6)
[1, 1, 1, 1, 1, 3, 4, 5, 6]
[6, 5, 4, 3, 1, 1, 1, 1, 1]
7.len和index函数
这里不做多解释,len为长度,index可以找到元素索引
lst7=[1,24,5,2,2]
print(len(lst7))
print(lst7.index(2))
8.sum求和函数
顾名思义就是对列表所有元素进行求和运算
b=[12,42,52,12,12,1]
print(sum(b))
三、字典
1.字典的创建与特征
dict1 = {"name": "阿粥", "age": 100, "height": 182}
print(dict1)
#输出结果:
{'name': '阿粥', 'age': 100, 'height': 182}
键值对的形式存在:字典通过键值对存储数据。键类似于索引,指向唯一的值。
- 本身是无序的:字典中的元素是无序的。我们不能像列表那样通过索引位置访问元素,而是通过键来访问。
- 唯一的键:每个键必须是唯一的,但值则可以重复。
2.keys,values,items
keys返回所有键
values返回所有值
items返回键和值
dict1 = {"name": "阿粥", "age": 100, "height": 182}
print(dict1)
print(dict1.keys())
print(dict1.values())
print(dict1.items())
总结
提示:这里对文章进行总结:
以上就是今天要讲的内容,本文仅仅简单介绍了字符串函数和列表,字典函数的使用,加油!