学习背景:
随着互联网的普及,越来越多的工作由计算机代替人工完成,大大提高了效率。但是计算机无法像人一样自主完成工作,于是有了编程语言来向计算机下达指令,python就是众多编程语言中的一种,语法简洁、易学、拥有强大的第三方库等特点使之成为数据分析领域最常用的编程语言之一,Anaconda便是python的第三方包管理。
变量/数据类型
既然是做数据分析,那么必然是涉及到存放数据,变量就是存放在内存中的一个值,基于变量的数据类型Python解释器会将变量分配到指定内存中,变量数据类型不需要申明,但是创建以后就不能修改数据类型。Python共有6个基本数据类型,分别是数字、字符串、列表、元组、字典、集合。
数字是不可变的数据类型,直接用=就可以创建,当变量的值发生改变时,相当于创 建一个新的变量,由Python解释器分配一个新的地址空间,
例如:
序列是Python中最基本的数据结构,序列中的每个元素都分配了一个数字,下标索引都是从0开始,以此类推;序列可以进行索引,切片,加,乘,检查成员等操作,还内置了确定序列的长度以及确定最大和最小的元素的方法;
字符串是Python中最常用的Python序列内置类型,使用 '' or "" 来创建字符串,Python不支持单字符,单字符也是作为字符串来使用;当需要获取字符串的某一位时,可以使用方括号,
例如:
列表也是常用的Python序列内置类型,使用[,,,]来创建列表,元素可以不是相同的数据类型,并且元素可以被修改,可以完成访问列表的某个元素,增加列表元素,更新列表,删除列表中的元素等操作,
例如:
元组与列表类似,不同之处在于元组的元素不能修改,元组使用小括号,列表使用方括号,创建时只需在括号中添加元素,并用逗号隔开,
例如:
(注意:当元组内的元素只有1个时要加","号,不然会被当成数字或者字符处理,元组和列表一样,下标索引也是从0开始)
字典是一种可变容器,且可存储任意类型对象。字典的每个键值对(key:value)都用","号分割,整个字典都在{}号内;字典中键不能相同的且只能是不可变的数据类型,但是值可以是任何的Python对象没有限制,可以完成增删查改等基本操作,
例如:
集合是一种无序的不重复序列,可以使用{}和set()来创建,但是在创建一个空集合时必须使用set()来创建,因为{}默认是创建字典,但是在创建有多个字符串的集合时必须用{},因为set()只能包含一个参数;集合也有增删查操作,还有获取集合元素个数,判断元素是否在集合中,清空集合等操作,
例如:
Python控制语句
截止到目前我们所写的代码,Python都是按照顺序执行的;但是如果你想改变执行顺序,让程序根据不同情况执行不同的语句,例如根据时间打印“早上好”或者“晚上好”,那就需要用到Python的控制语句,Python更有三种控制语句,分别是if、for、while,其中for和While都可以做循环语句。
if语句用来检验一个条件,如果 条件为真,我们运行if-块,否则我们处理else-块,elif-块作为2次判断,可以写可以不写,
例如:
while语句是一个循环语句,只要在条件为真的情况下,就会一种重复执行一块语句;while语句有一个可选的else从句。
例如:
http://for.in是一个循环语句,它在一个序列的对象上递归,逐一使用队列中的每个元素,
例如:
函数是一段可以完成特定功能并且能被复用的程序块,每一块都有一个名称,可以通过调用函数名在程序的任何一个地方运行这个程序块,这就是调用函数;函数通过def关键字定义,def关键字后跟一个函数的名称,然后跟一对圆括号;圆括号中可以加参数也可以不加,圆括号后面是一对:号,接下来的语句便是函数体,
例如:
模块就是一个包含了所有定义的函数和变量的文件,为了在其他程序中重用模块,模块的文件名必须以.py为扩展名,模块可以从其他程序输入以便利用它的功,主要有import....和from...import两种方式。
数据结构基本上就是可以处理一些 数据的结构,或者说是用来存储一组相关的数据,在Python中有三种内建的数据结构列表、元组和字典。