一、学习python数据分析前的准备工作:下载Anaconda
anaconda是一个包管理器和环境管理器,其内置的jupyter notebook 功能非常强大,可以在jupyter notebook 中敲入代码、文字、图片形成我们所需的数据分析报告。
anaconda的两个下载渠道:
1.Downloads - Anacondawww.anaconda.com
(官网-外国服务器下载速度比较考验耐心)
2.Tsinghua Open Source Mirrormirrors.tuna.tsinghua.edu.cn
(清华大学镜像站-速度快)
安装成功后启动anaconda prompt内输入jupyter notebook 单击回车即可启动jupyter notebook啦~
二、python基础知识梳理
1.数据类型
String(字符串):如人的姓名,地名等文本,可以用两个英文状态下的单引号来表示(object)
int(整型):1,2,3,4,不带小数点
float(浮点型):1.2,1.456,4.689
bool(布尔型):True,False
容器:1)List列表2)Tuple元祖3)Set集合4)Dictionary字典
空值:None
2.变量
在python代码里用变量来存放数据,python语言里用=来给变量赋值(类比:在R语言里面用<-来给变量赋值)
eg:
a='小明'
b=5
c=6
3.注释
第一种:#
第二种:''' '''
示例如下:(python不会执行注释里面的内容)
3.入门list/set/tuple/dictionary
3.1 list
3.1.1方括号中添加元素并使用逗号分割开即可定义一个新的列表,切片时列表内的第一个元素的索引为0,最后一个元素的索引为-1
3.1.2 list使用append方法可在list末尾添加元素,list使用pop方法可以删除末尾的元素,list使用del加索引的方法可以删除list内指定位置的元素
3.2 tuple
3.2.1小括号中添加元素并使用逗号分割元素即可创建元组,元组内的元素不支持修改
3.3 set
3.3.1 花括号中添加元素并使用逗号分割元素即可创建集合,集合内不包括重复的元素
使用update方法加列表可更新集合,使用discard方法可删除集合内的元素
3.4 dictionary
key和value用冒号:对应,每个映射关系用逗号,分割,包括在花括号{}里面
4.if条件判断
if后面是判断条件,if条件需要加冒号:,多个if条件时后续的if可用elif表示,else后表示不符合前面if条件后返回的结果
5.for循环
把容器中的每一个数据进行重复处理,continue用于跳出当前循环,break用于退出整个循环
6.python里面常用的的包
在anaconda内可通过conda install +包名来实现包的安装
pandas、numpy、matplotlib(绘图包)、sklearn(机器学习包)
import可以引入需要的包,包内有强大的函数,可以提高我们的运算效率
7.def自定义函数
我这边用pandas包读取了一个链家的数据集,想取出每个经纪人成交单价排名前5的成交记录,这里我自定义了一个函数用以实现取出前5套:data数据长这样
我这里重新定义了一个top函数,这个top函数对组有效,对组内‘cjdanjia’这一列数据进行降序排序,并进行切片,返回组内前5名的数据
以上内容就是我整理的python的基础知识~