一、为什么要学些python
编程语言的作用是通过计算机实现人的想法和需求。全球有600多中编程语言,最流行的有20多种,随着时间的推移,python越来越流行。中国开发者报告中,python排名前五。随着人工智能的发展,python也会越来越重要。
二、如何安装python
安装anaconda包管理器和环境管理器jupyter notebook
三、快速学完python的四个关键点
(一)数据及数据类型
1、 数据
(1)数据概念:输入数据给程序程序处理后输出一个结果,在代码里用变量存放数据,并用"="为变量赋值,变量的概念基本和代数方程的是一样的,不过在代码里变量不仅可以使数值还可以是任意的数据类型。
(2)变量名称由两部分组成:名称+数据类型,前半部分代表数据的意义后半部分代表变量的数据类型。举例:nameStr="张三"(nameStr是变量名称,变量值是张三,Str是数据类型String) 变量名称可以任意命名,但是为了使用方便,应按上述格式命名。
(3)python中给变量起名字注意的规则有:1)数字不能作为变量名称的开头。 2)大小写敏感,不能写错大小写。
(4)python中加注释: 1)方法1:#;2)方法2:''' '''
2、数据类型
数据类型分5大类:字符串、数字、容器、布尔、None
(1)字符串(string):最常见的数据类型,可以用‘’或者“”创建字符串,可以用+将两个字符串合并
(2)数值(Number):主要分为整型和浮点型和复数
(3)容器:是为了方便处理数据出现的,它可以吧不同的数据放在一起方便查找和使用,python中为了存放不同的数据,分别有不同的容器。
容器有4种分别是:列表(List)、元组(Tuple)、集合(Sets)、字典(Dictionary)。
学习容器主要掌握两个方面:a.如何定义容器?b.如何使用容器:容器的四个操作:增加、删除、查询、修改。
1)列表
- 列表的定义:列表用[ ]定义。列表的索引从0开始。
2)元组:python中元组和列表有些类似,不过元组的元素是不能修改的,只能查询,因此元组用的比较少。
注意括号不能写错:
3)集合:是一个没有重复元素的容器,做数据分析时,将有重复元素的数据放入集合中,她会自动帮你删除重复值。
4)字典:适用于存储映射关系的容器,字典的的每个映射关系也就是介质对key和value的对应关系用冒号分隔开,每个介质对用逗号分隔开。
(4)布尔:布尔类型的数据只有两个成员:True、False,主要用在条件判断上面,主要是判断一种条件是否发生判断标准,发生是True,未发生False,python区分大小写,因此,True和False开头不能写错。
(5)None:空值,python里一个特殊的值,不能理解为0。
总结:数据类型按是否可修改分为两大类:字符串、数字、元组是不可更改的对象,其余列表、集合、字典、布尔、None是可更改的对象。
(二)条件判断
1、条件判断代码的一般格式:
if 边界条件:
缩进 要做的事情1
else:
缩进 要做的事情2
注意:
(1)条件判断代码的阅读规则:代码从if开始逐行检查,从上到下执行。若符合if后面的边界条件就执行要做的事情1,否则就执行else后面要做的事情2。
(2)代码块:在python中当语句以冒号结尾时,缩进的语句视为代码块。按照约定俗成的管理,坚持始终用四个空格的缩进。
(3)边界条件:通常用下面2种套路
1)值比较:大于(>)、小于(<)、大于等于(>=)、小于等于(<=)、不等于(!=)、等于(==)
2)逻辑比较:并且(and)、或者(or)、不是(not)
例1:
例2:
2、多个条件判断
多条件判断代码格式:
if 边界条件1:
缩进 要做的事情1
elif边界条件2:
缩进 要做的事情2
else:
缩进 要做的事情3
(三)循环(批量处理数据)
循环是指计算机上重复的做一件事情,即批量处理数据。python中这种批量处理数据的循环有两种:一种是for循环,一种是while循环。(while不常见)
1、for循环:
for循环一般和批量处理数据分不开:把容器中的每一个数据都按照特定的规则进行重复处理。
for循环语法(代码块格式):
for i in容器:
缩进 要做的事情
(1)容器:是指前面讲到的容器数据类型:列表、元组、集合、字典,容器中存放了我们要批量处理的多个数据。
(2)每一个数据:是指for循环中的循环变量,上面格式中for后面的 i (i代表容器中的每一个数据,这个变量名称可以命名为自己喜欢的名字,用于代表容器中的每一个数据,当容器中有大量数据前提下,内部数据一个个取名是不现实的,所以在for循环中通过for后面的循环变量名称解决这问题)
(3)要做的事情:在循环中要做的事情全部写在换行后的缩进后面,所有缩进后的代码被认为是这次循环中要做的事情
(4)停止:循环会在容器中所有的数据被访问过后停止。
例1:
例2:对字典进行循环
2、continue 用于跳出当前循环
跳出当前循环,执行下一个循环
3、break用于退出整个循环
(四)函数
什么是函数?函数是实现某个特定功能可重复使用的代码块。print()就是一个函数,这是是个我们可以直接拿来用的函数,功能是输出数据到屏幕,而且可以重复使用。
函数的3个功能:1功能;2输入;3输出。
很多时候我们都是调用python内置函数或者第三方包里的函数处理数据,当遇到复杂的业务逻辑是,就需要我们自己编写函数。
1、自定义函数
自定义函数模板语法:
def 函数名称(参数1,参数2):
缩进 函数体
return 输出
2、使用函数
函数定义好后,调用函数,函数中参数是如何传递的,函数参数的传递有两种方法:
(1)按定义函数时函数参数的顺序传入参数,调用时候函数参数的数量必须和声明时的一样多。
(2)使用函数参数的名称传入参数值。
(3)函数参数:不可变数据类型
当函数参数是不可变数据类型(字符串、元组、数字);使用函数时,参数传递的只是该数据类型的值(相当于复制一份)本身
(4)函数参数:可变数据类型
如果函数参数是可变的数据类型,那么传出的该数据的变量引用地址,当函数内部修改数据时,原始的数据也就改变了。
(5)变量作用域
程序的变量并不是在哪个位置都可以访问的,访问权限取决于这个变量是在哪里赋值的。这就是变量作用域的作用,变量作用域决定了在哪里程序可以访问哪个变量名称,python的作用域有两种:全局作用域和局部作用域。定义在函数内部的变量拥有一个局部作用域,定义在函数外部的变量有全局的作用域。局部变量只能在被声明的函数内部访问,全局变量可以在整个程序范围内访问。
四、模块
1、模块的概念
随着用户需求的不断提出程序代码越写越多,越来越不容易修改和查找,为了方便代码的维护,将不同功能的函数分门别类的放在不同的文件中,每个文件包含的代码就相对较少,很多编程语言都采用这种结构来组织代码。在python中一个文件名后缀为.py文件就称之为一个模块,里面包含已定义的所有的函数和变量的文件,每个模块都有特定的功能。当我们想使用某个功能时不需要从0开始写代码,将模块引入我们的程序中,就可以使用这个模块中的功能。
2、如何使用模块
python中模块有两种:内置模块、第三方的包。
(1)如何使用python内置模块?
(2)如何使用第三方包?
先安装:进入conda环境,然后安装pandas包,然后使用:
3、如何将模块引入的三种语法
(1)import 包名称
这种语法将整个模块导入到当前的代码中
(2)import 包名称 as 别名
(3)from 包名称 import 函数名
这种语法,不会将整个模块导入,只会将你需要的函数名引入进来
五、数据结构
前面在介绍数据类型时说容器在编程中也叫数据结构,介绍了python中几个容器,现在介绍更高级的容器,也就是常用的数据结构。只有熟悉数据结构,才能选择合适的容器存放数据,来提高操作数据的效率。
collections是python内建的集合模块,提供了许多有用的数据结构比如:
(1)双向链表queue:实现数据结构:队列和栈
队列:
栈:栈有点像生活中的木桶,当我们向栈中加入新的元素就是入栈,新的元素在最上面,当我们要删除元素就是出栈,删除的元素也是栈中最上面的元素。最上面的元素是栈顶元素。
(2)排序字典OrderedDict:构建有顺序的字典
python默认的字典:key无序
colletion中排序字典:key有序
(3)计数器Counter:统计功能