![](https://img-blog.csdnimg.cn/20190813155243313.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据分析
重新刷一遍炼数成金的《Python数据分析》课程,整理成笔记,以供参考。
RealEmperor
这个作者很懒,什么都没留下…
展开
-
Python数据分析_第01课:Python概览_笔记
文章目录变量类型打印行和缩进多行语句引号注释空行码组帮助变量赋值数字删除字符串列表元组字典运算符比较运算符赋值运算符位运算符逻辑运算符成员运算符身份运算符运算符优先级变量类型打印# 打印print("Hello, Python!")Hello, Python!行和缩进# 行和缩进if True: print("True")else: print("False"...原创 2019-08-13 17:05:41 · 692 阅读 · 0 评论 -
Python数据分析_第02课:Python流程控制_笔记
文章目录条件语句if...elif...else循环语句while语句for语句嵌套循环其他格式字符串时间与日期自定义函数匿名函数return语句键盘输入打开与关闭文件异常处理自定义异常条件语句if…elif…else# 条件语句'''if 判断条件: 执行语句……else: 执行语句……'''flag = Falsename = 'python'if nam...原创 2019-08-13 17:09:24 · 575 阅读 · 0 评论 -
Python数据分析_第03课:NumPy介绍_笔记
文章目录NumPy对向量的处理效率比较numpy数组创建多维数组选取数组元素numpy数据类型数据类型转换数据类型对象字符编码type类的属性创建自定义数据类型数组与标量的运算一维数组的索引与切片多维数组的切片与索引布尔型索引花式索引数组转置改变数组的维度组合数组数组的分割数组的属性数组的转换NumPy对向量的处理向量相加-Python方式# 向量相加-Pythondef pythonsu...原创 2019-08-13 17:11:22 · 666 阅读 · 0 评论 -
Python数据分析_第04课:NumPy基础_笔记
numpyimport numpy as npfrom numpy.random import randn#通用函数arr = np.arange(10)np.sqrt(arr)array([ 0. , 1. , 1.41421356, 1.73205081, 2. , 2.23606798, 2.44948974...原创 2019-08-13 17:37:16 · 689 阅读 · 0 评论 -
Python数据分析_第05课:Pandas基础及数据读写_笔记
文章目录pandasSeriesdataframe索引对象数据读取读取文本格式数据 pd.read_csvOSError: Initializing from file failed 处理方法文件写出 to_csvExcel数据生成xls工作薄生成xlsx工作薄从工作薄中读取使用pandas读取JSON数据二进制数据格式HDF5格式使用HTML和Web API使用数据库pandasSeries...原创 2019-08-13 17:39:47 · 871 阅读 · 0 评论 -
Python数据分析_第06课:数据清洗与初步分析_笔记
文章目录缺失值处理——拉格朗日插值法dataframe合并索引上的合并轴向连接合并重叠数据重塑层次化索引长宽格式的转换移除重复数据利用函数或映射进行数据转换数据标准化最小-最大规范化零-均值规范化小数定标规范化替换值重命名轴索引离散化与面元划分检测和过滤异常值排列与随机采样计算指标与哑变量属性构造字符串对象方法正则表达式pandas中矢量化的字符串函数示例:USDA食品数据库缺失值处理——拉格朗...原创 2019-08-13 17:42:11 · 2088 阅读 · 0 评论 -
Python数据分析_第07课:绘图与可视化_笔记
文章目录matplotlib创建图表更多简单的图形figure与subplotmatplotlib基本设置颜色、标记和线型设置标题、轴标签、刻度以及刻度标签添加图例注释以及在subplot上绘图画图形图表的保存pandas中的绘图函数线图柱形图直方图和密度图散点图Matplotlib作图误差条形图饼图等高线图3D图像3d柱形图3d直方图matplotlib创建图表import matplotl...原创 2019-08-13 18:00:59 · 1164 阅读 · 0 评论 -
Python数据分析_第08课:数据聚合与分组处理_笔记
文章目录数据聚合、分组运算与转换、透视表与交叉表GroupBy对分组进行迭代选择一个或一组列通过字典或Series进行分组通过函数进行分组通过索引进行分组数据聚合面向列的多函数应用分组及运算和转换apply方法禁止分组键分位数和桶分析用特定于分组的值填充缺失值随机采样和排列不显示分组关键字分组加权平均数和相关系数透视表交叉表2012联邦选举委员会数据分析根据职业和雇主统计赞助信息对出资额分组根据州...原创 2019-08-13 18:03:21 · 587 阅读 · 0 评论 -
Python数据分析_第09课:假设检验_笔记
文章目录统计学描述统计学数据特征描述分析集中趋势离散程度的描述多元数据的数据特征假设检验拒绝域与显著性水平决定规则第一类错误与第二类错误检验统计量(test statistics)统计学统计学可以分为:描述统计学与推断统计学描述统计学 :使用特定的数字或图表来体现数据的集中程度和离散程度。例:每次考试算的平均分,最高分,各个分段的人数分布等,也是属于描述统计学的范围。推断统计学 :根据样本...原创 2019-08-14 15:59:20 · 759 阅读 · 0 评论 -
Python数据分析_第10课:线性回归_笔记
文章目录线性回归模型实例:商品价格预测读取数据画散点图计算相关系数矩阵构建X、Y数据集直接根据系数矩阵公式计算求解回归方程系数利用现有库求解线性回归1训练集和测试集的构建拟合结果预测误差评估线性回归2测试集和训练集的构建拟合预测误差评估线性回归模型实例:商品价格预测读取数据import numpy as npimport pandas as pd###线性回归##### 读取数据d...原创 2019-08-15 12:44:01 · 784 阅读 · 0 评论 -
Python数据分析_第11课:logistic回归_笔记
文章目录逻辑回归案例1:银行贷款违约分析参数初始化建立随机逻辑回归模型,筛选变量建立逻辑回归模型非线性回归案例2多项式模型对数模型指数模型幂函数模型画图逻辑回归案例1:银行贷款违约分析参数初始化import pandas as pd# 参数初始化filename = 'data/bankloan.xls'data = pd.read_excel(filename)print(da...原创 2019-08-15 16:06:51 · 762 阅读 · 0 评论 -
Python数据分析_第12课:时间序列分析_笔记
文章目录时间基本处理字符串转日期pands中的时间序列日期范围、频率与移动时间序列可视化时间序列案例分析参数初始化时序图自相关图平稳性检测差分后的结果时序图自相关图偏自相关图平稳性检测白噪声检验建立ARIMA模型(差分整合移动平均自回归模型)给出模型报告预测时间基本处理import numpy as npimport pandas as pdfrom pandas import Serie...原创 2019-08-19 10:51:44 · 1105 阅读 · 0 评论 -
Python数据分析_第13课:分类算法_笔记
文章目录分类算法案例:预测饭店销量导入数据拆分训练数据与测试数据训练KNN分类器测试结果准确率训练贝叶斯分类器测试结果准确率决策树测试结果准确率SVM测试结果准确率分类算法有很多,这里通过一个案例介绍一下常用的几个算法的应用,包括:K最近邻(kNN,k-NearestNeighbor)分类算法、贝叶斯分类算法、决策树、支持向量机(Support Vector Machine, SVM)。分类算...原创 2019-08-19 17:22:30 · 573 阅读 · 0 评论 -
Python数据分析_第14课:聚类算法_笔记
文章目录基础知识层次聚类法层次聚类法案例KMeansKMeans案例基于密度的方法:DBSCAN基本概念DBSCAN 聚类算法案例基础知识聚类算法和分类算法相似,不过分类算法是监督学习,聚类算法是非监督学习。按照距离聚类,距离分为欧氏距离、马氏距离、余弦距离……。欧氏距离(euclidean):通常意义下的距离dij(2)=∑k=1p(xik−xjk)2d_{ij}(2)=\sqrt{...原创 2019-08-20 18:50:59 · 749 阅读 · 1 评论 -
Python数据分析_第15课:降维方法_笔记
文章目录主成分分析(PCA)基本概念协方差矩阵特征值与特征向量点积案例:鸢尾花数据集的降维因子分析为何要降维?1.使数据集更易使用2.降低算法计算开销3.去除噪声4.使得结果易懂降维的方式主要有两种方式:1.主成分分析(PCA)——坐标系转换2.因子分析——隐变量主成分分析(PCA)优点:降低数据的复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用信息适用数据类型...原创 2019-08-21 18:23:55 · 768 阅读 · 0 评论