第2章 Python数据分析简介
【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】
一、python的简介
Python是一门简单易学且功能强大的编程语言。它拥有高效的高级数据结构,并且能够用简单而又高效的方式进行面向对象编程。Python优雅的语法和动态类型,再结合它的解释性,使其在大多数平台的许多领域成为编写脚本或开发应用程序的理想语言。
要认识Python,首先得明确一点,Python是一门编程语言!这就意味着,至少原则上来说,它能够完成Matlab能够做的所有事情(因为大不了从头开始编写),而且大多数情况下,同样功能的Python代码会比Matlab代码更加简洁、易懂;而另一方面,因为它是一门编程语言,所以它能够完成很多Matlab不能做的事情,比如开发网页、开发游戏、编写爬虫来采集数据等。
Python以开发效率著称,也就是说它致力于以最短的代码完成同一个任务。Python通常为人诟病的是它的运行效率,而Python还被称为“胶水语言”,它允许我们把耗时的核心部分用C/C++等更高效率的语言编写,然后由它来“黏合”,这很大程度上已经解决了Python的运行效率问题。事实上,在大多数数据任务上,Python的运行效率已经可以媲美C/C++语言
二、基础平台的搭建
三、python使用入门
1. 运行方式
运行Python代码有两种方式,一种方式是启动Python,然后在命令窗口下直接输入相应的命令;另外就是将完整的代码写成.py脚本,如hello.py,然后通过pythonhello.py执行。
2. 基本命令使用
1>赋值运算:a=2
2>乘法:a*2
3>幂:a**2
4>多重赋值:a,b,c=2,3,4
5>字符串的使用:
6>判断与循环:
①判断语句:
Python一般不用花括号{},也没有end语句,它是用缩进对齐作为语句的层次标记。同一层次的缩进量要一一对应
②for循环
③while循环
in是用来判断一个元素是否在列表/元组中, range用来生成连续的序列,一般语法为 range(a,b,c),表示以a为首项、c为公差且不超过b-1的等差数列,
7>函数
def来定义函数
函数返回值可以是各种形式
8>匿名函数
3.数据结构
其中还讲到了函数式编程
4.库的导入与添加
(1)Python本身内置了很多强大的库,如数学相关的math库,可以为我们提供更加丰富复杂的数学运算:
import math
math.sin(1) #计算正弦
math.exp(1) #计算指数
math.pi #内置的圆周率常数
导入库的方法,除了使用“import 库名”之外,还可以为库起一个别名:
import math as m
m.sin(1) #计算正弦
如果并不需要导入库中的所有函数,可以特别指定导入函数的名字:
from math import exp as e #只导入math库中的exp函数,并起别名e
e(1) #计算指数
sin(1) #此时sin(1)和math.sin(1)都会出错,因为没被导入
直接地导入库中的所有函数:
from math import * #直接的导入,也就是去掉math.,但如果大量地这样引入第三库,就容易引起命名冲突。
exp(1)
sin(1)
我们可以通过help(‘modules’)命令来获得已经安装的所有模块名。
(2)导入future特征(For 2.x)
Python 2.x与3.x之间的差别不仅仅在内核上,也表现在代码的实现中。比如,在2.x中,print是作为一个语句出现的,用法为print a;但是在3.x中,它是作为函数出现的,用法为print(a)。为了保证兼容性,本书的基本代数是使用3.x的语法编写的,而使用2.x的读者,可以通过引入future特征的方式兼容代码,如,
#将print变成函数形式,即用print(a)格式输出
from __future__ import print_function
#3.x的3/2=1.5,3//2才等于1;2.x中3/2=1
from __future__ import division
(3)添加第三方库
Python自带了很多库,还需要添加一些第三方的库来拓展它的功能
安装第三方库一般有以下几种思路
四、Python数据分析工具
1.Numpy提供数组支持,以及相应的高效的处理函数
2.Scipy提供矩阵支持,以及矩阵相关的数值计算模块
3.Matplotlib强大的数据可视化工具、作图库
4.Pandas强大、灵活的数据分析和探索工具
5.StatsModels统计建模和计量经济学,包括描述统计、统计模型估计和推断
6.Scikit-Learn支持回归、分类、聚类等的强大的机器学习库
7.Keras深度学习库,用于建立神经网络以及深度学习模型
8.Gensim用来做文本主题模型的库,文本挖掘可能用到
安装命令:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scipy
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple matplotlib
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple statsmodels
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-learn
五、Python数据分析工具测试
2.
5.
六、Python相应的题
1.打印f(x)=x^2+x+1 , 1=<x<100
- 打印f(x,y)=x2+y2, 1<x<5, 1<y<5
- 计算1+2+3+4+5的和
- 任意给定一个范围,输入上限n和下限m,输出这个范围[n,m]内一个奇数数列
七、windows下安装Keras2.1.4(cpu版)
直接点超链接看我的文章就行了
【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】