一.为什么要学习python
二.如何安装Python
三.快速学会Python的4个关键点
四.什么是模块
五.数据结构
一:为什么要学习Python
1.大数据和人工智能的火爆使得Python很流行
2.python 和 R 是相对高收入国家较常使用的编程语言
3.中国开发者常用的开发语言Python 排在前五之中
二:如何安装Python
因为Anaconda 和 Jupyter notebook 已经成为数据分析的标准环境,所以接下来说明Anaconda 和 Jupyter notebook.
1.Anaconda是什么
Anaconda是conda发展出来的,附带一大批常用数据科学包的数据分析的环境。
2. 如何安装Anaconda
continuum.io/downloads (查看自己电脑是32位还是64位,别装错了)
你可以在Anaconda prompt(终端) 输入conda list 查看你已经在安装的内容
3.如何管理包
1)安装包
例如:要安装pandas ,在终端输入 conda install pandas
2)卸载包
例如:要卸载pandas,在终端输入 conda remove pandas
3)更新包
如果要更新所有的包,在终端输入 conda update --all
4)列出和搜索已经安装的包
conda list +conda search numpy(例子)
4.如何管理环境
0)安装nb_conda 用于notebook自动关联 nb_conda 的环境
1)创建环境:在终端中使用 conda create -n env_name package _names
例如:conda create -n py3 pandas.
2)创建环境时,可以指定要安装在环境中的Python的版本,conda create -n py3 python=3
3)进入环境,Windows用activate my_env进入,OSX/LINUX 用source activate my_env 进入,进入环境后,可以在终端提示符中看到环境名称。
4)离开环境:Windows用deactivate , OSX/LINUX 用source deactivate
5)共享环境:在当前的环境终端中输入 conda env export >environment.yaml 将当前的环境保存为yaml文件(包括Python版本和所有包的名称)。导出的环境文件如何在其他的电脑中使用,activate py3,然后使用你的命令更新你的环境:
/path/to/environment.yml 换成本地的实际路径 conda env update - f=
/path/to/environment.yml
6)列出环境:conda env list ,在当前的环境列表里,会有一个星号
7)删除环境:conda env remove-n env_name 删除指定的环境
三:快速学会Python 的四个关键点
数据 函数 条件判断 循环
1.数据 输入数据→程序→输出数据(结果)
在代码里,我们用变量来存放数据,并用等号为其赋值。变量名=意义+类型
1)数据类型: 字符串 ,数字 ,容器 ,布尔 ,None
字符串
定义字符串:①定义字符串:意义+类型
②用%格式化字符串
数值
整型:马云50岁
浮点型:我用马云的余额宝今天赚了3.53元
容器---列表(list)
定义列表:病人姓名
列表长度:
增加一个元素
删除一个元素
查询:使用下标索引来查询列表中的值,列表从零开始
修改:直接指定下标的值
list
容器----集合(sets):是一个没有重复元素的容器
定义gafata:六家公司的股票
增加:定义一个空的集合,使用update()增加元素
删除:
查找:
先删除再添加
容器--字典(dictionary)
定义字典:病人编号和姓名的映射关系
定义字典:excel病人数据储存
增加元素:
删除元素:
查询:根据病人编号查询病人信息
修改:
布尔类型
空值None
2.条件判断
条件判断案例
《摔跤吧爸爸》豆瓣评分 scoreNum=9.1
边界条件:逻辑判断:
多个条件判断:
3.循环:如何用循环批量处理数据
案例一:重复性工作
一天中吃第几次饭:
案例二:清洗GAFATA数据:
定义字典:6家公司GAFATA的股票
key是公司名称,value是股票代码
continue 用于跳出当前循环
break 用于退出整个循环:
查找苹果股票公司的代码
4.函数
如何自定义函数,
定义函数:函数功能:两个数相加
输入:x,y 是两个要相加的函数
输出:两数相加的和
如何使用函数,
函数参数:不可变数据类型:
字符串,数字,元祖这都是不可变数据类型,其他的都是可变数据类型
定义函数:改变数据的值,
使用函数:参数是不可变数据类型,传递的只是该数据的值,相当于复制一份
函数参数:可变数据类型:
使用函数:函数是可变数据类型,传递的是该变量的引用地址
变量作用域:Python一共有两种作用域,全局作用域,局部作用域
定义在函数内部的变量拥有一个局部作用域,定义在函数外面的拥有全局作用域。
局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。
5.模块
什么是模块:Python内置模块的使用:
第三方模块的使用:
使用conda命令安装包:conda install pandas,使用第三方模块:pandas,pandas 数据分析工具。
6.Python 的collection包
队列:队列就像是你去餐厅外婆家吃饭,后来的排在后面,叫入队,取完票从队列首部离开,叫出队。
导入collections 包
定义队列:排队吃饭人的编号
入队:在队尾部插入元素,出队:在队列头部删除元素
栈(Stack)
栈这种数据就是生活中的木桶,你往栈中加入新的元素就是入栈,新的元素总是放在木桶的最上面。
定义栈:浏览我知乎主页的顺序,
入栈:在栈顶加入元素,出栈:删除顶部的元素
排序字典:OrderedDict: 按照插入key的顺序,对字典进行排序
计数器:Counter