python找出第二大的数据_数据分析之Python第一二章

一.为什么要学习python

二.如何安装Python

三.快速学会Python的4个关键点

四.什么是模块

五.数据结构

一:为什么要学习Python

1.大数据和人工智能的火爆使得Python很流行

2.python 和 R 是相对高收入国家较常使用的编程语言

3.中国开发者常用的开发语言Python 排在前五之中

二:如何安装Python

因为Anaconda 和 Jupyter notebook 已经成为数据分析的标准环境,所以接下来说明Anaconda 和 Jupyter notebook.

1.Anaconda是什么

Anaconda是conda发展出来的,附带一大批常用数据科学包的数据分析的环境。

2. 如何安装Anaconda

continuum.io/downloads (查看自己电脑是32位还是64位,别装错了)

你可以在Anaconda prompt(终端) 输入conda list 查看你已经在安装的内容

3.如何管理包

1)安装包

例如:要安装pandas ,在终端输入 conda install pandas

2)卸载包

例如:要卸载pandas,在终端输入 conda remove pandas

3)更新包

如果要更新所有的包,在终端输入 conda update --all

4)列出和搜索已经安装的包

conda list +conda search numpy(例子)

4.如何管理环境

0)安装nb_conda 用于notebook自动关联 nb_conda 的环境

1)创建环境:在终端中使用 conda create -n env_name package _names

例如:conda create -n py3 pandas.

2)创建环境时,可以指定要安装在环境中的Python的版本,conda create -n py3 python=3

3)进入环境,Windows用activate my_env进入,OSX/LINUX 用source activate my_env 进入,进入环境后,可以在终端提示符中看到环境名称。

4)离开环境:Windows用deactivate , OSX/LINUX 用source deactivate

5)共享环境:在当前的环境终端中输入 conda env export >environment.yaml 将当前的环境保存为yaml文件(包括Python版本和所有包的名称)。导出的环境文件如何在其他的电脑中使用,activate py3,然后使用你的命令更新你的环境:

/path/to/environment.yml 换成本地的实际路径 conda env update - f=

/path/to/environment.yml

6)列出环境:conda env list ,在当前的环境列表里,会有一个星号

7)删除环境:conda env remove-n env_name 删除指定的环境

三:快速学会Python 的四个关键点

数据 函数 条件判断 循环

1.数据 输入数据→程序→输出数据(结果)

在代码里,我们用变量来存放数据,并用等号为其赋值。变量名=意义+类型

1)数据类型: 字符串 ,数字 ,容器 ,布尔 ,None

字符串

定义字符串:①定义字符串:意义+类型

②用%格式化字符串

数值

整型:马云50岁

浮点型:我用马云的余额宝今天赚了3.53元

容器---列表(list)

定义列表:病人姓名

列表长度:

增加一个元素

删除一个元素

查询:使用下标索引来查询列表中的值,列表从零开始

修改:直接指定下标的值

list

容器----集合(sets):是一个没有重复元素的容器

定义gafata:六家公司的股票

增加:定义一个空的集合,使用update()增加元素

删除:

查找:

先删除再添加

容器--字典(dictionary)

定义字典:病人编号和姓名的映射关系

定义字典:excel病人数据储存

增加元素:

删除元素:

查询:根据病人编号查询病人信息

修改:

布尔类型

空值None

2.条件判断

条件判断案例

《摔跤吧爸爸》豆瓣评分 scoreNum=9.1

边界条件:逻辑判断:

多个条件判断:

3.循环:如何用循环批量处理数据

案例一:重复性工作

一天中吃第几次饭:

案例二:清洗GAFATA数据:

定义字典:6家公司GAFATA的股票

key是公司名称,value是股票代码

continue 用于跳出当前循环

break 用于退出整个循环:

查找苹果股票公司的代码

4.函数

如何自定义函数,

定义函数:函数功能:两个数相加

输入:x,y 是两个要相加的函数

输出:两数相加的和

如何使用函数,

函数参数:不可变数据类型:

字符串,数字,元祖这都是不可变数据类型,其他的都是可变数据类型

定义函数:改变数据的值,

使用函数:参数是不可变数据类型,传递的只是该数据的值,相当于复制一份

函数参数:可变数据类型:

使用函数:函数是可变数据类型,传递的是该变量的引用地址

变量作用域:Python一共有两种作用域,全局作用域,局部作用域

定义在函数内部的变量拥有一个局部作用域,定义在函数外面的拥有全局作用域。

局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。

5.模块

什么是模块:Python内置模块的使用:

第三方模块的使用:

使用conda命令安装包:conda install pandas,使用第三方模块:pandas,pandas 数据分析工具。

6.Python 的collection包

队列:队列就像是你去餐厅外婆家吃饭,后来的排在后面,叫入队,取完票从队列首部离开,叫出队。

导入collections 包

定义队列:排队吃饭人的编号

入队:在队尾部插入元素,出队:在队列头部删除元素

栈(Stack)

栈这种数据就是生活中的木桶,你往栈中加入新的元素就是入栈,新的元素总是放在木桶的最上面。

定义栈:浏览我知乎主页的顺序,

入栈:在栈顶加入元素,出栈:删除顶部的元素

排序字典:OrderedDict: 按照插入key的顺序,对字典进行排序

计数器:Counter

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值