python数据分析简介

pyhton以最短的代码完成任务,因此运行效率并不高,又称“胶水语言”,因为它允许我们把耗时的核心部分用C/C++等更高效率的语言编写,然后由它来“黏合”,来解决了运行效率的问题。

数据结构

python有四个内建的数据结构——List(列表),Tuple(元组),Dictionary(字典),Set(集合),它们统称为“容器(container)”。
列表和元组都是序列结构,列表用方括号标记[],元组用圆括号()标记,二者的区别是,列表可以被修改,元组不能被修改。
“列表解析”这一功能能够简化我们队列表内元素逐一进行操作的代码:b=[i+2 for i in a]代替
for i in a:b.append(i+2).
字典实际是一个映射,有自己定义的键。
集合中的元素不重复且无序。

函数式编程(泛函编程)

函数式编程主要由几个函数的使用构成:lambda(),map(),reduce(),filter()。
**lambda()**用来自定义“行内函数”深入理解lambda()函数
**map()**函数用于逐一遍历,代替了类似列表解析的功能,map()函数
**reduce()**函数用于递归计算,reduce()函数
**filter()**函数式一个过滤器,用来筛选出列表中符合条件的元素,使用此函数需要一个返回值为bool型的函数filter()函数

python数据挖掘相关扩展库

Numpy

python并没有提供数组支持,Numpy提供数组支持,以及相应的高效的处理函数。后续的scipy,matplotlib,pandas等库都依赖于它。
Numpy库入门
Numpy库常用函数大全

Scipy

提供矩阵支持,以及矩阵相关的数值计算模块,包含的功能有最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,信号处理,图像处理,常微分方程求解等。
科学计算库Scipy

Matplotlib

强大的数据可视化工具,作图库,主要用于二维绘图,也可以进行简单的三维绘图。
Matplotlib官方中文文档
绘图库入门

Pandas

强大灵活的数据分析和探索工具,它的基本数据结构是Series和DataFrame,Series就是序列,类似一维数组,而DataFrame相当于二维表格,类似二维数组。
基础详解
Series类型与基本操作详解

StatsModels

统计建模和计量经济学,包括描述统计,统计模型估计和推断。

Scikit-Learn

支持回归,分类,聚类等的强大的机器学习库

Keras

深度学习库,用于建立神经网络及深度学习网络

Gensim

用来做文本主题模型的库,文本挖掘可能用到

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值