![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析整理
sayasora
这个作者很懒,什么都没留下…
展开
-
Python&SPSS完成空气质量状况的指数(AQI)分析
记一次课程作业,利用所给数据,以AQI指数(空气质量状况指数)为因变量,其他指标为解释变量,建立线性回归分析模型,并形成分析报告。Python&SPSS完成AQI指数分析题目要求原始数据数据处理数据总览“最高”&“最低”变量处理“风向”变量处理“星期”变量处理“天气”变量处理数据分析多重共线性新建“温差”变量回归建模数据导入SPSS线性回归操作SPSS结果分析模型概要模型比较排除的变量共线性诊断异常个案诊断模型回归系数残差检验模型的不足第二次数据处理“星期”变量处理第二次建模SPSS分析原创 2020-10-15 18:14:04 · 7023 阅读 · 10 评论 -
python实现非标准正态分布下概率密度有关计算
总目录:Python数据分析整理之后马上要学习朴素贝叶斯算法了,为之后的学习做好铺垫,重新用python实现了一下数据正态性的检验。根据数据的均值方差,求出小于某个值的概率,或者根据概率求出这个值是多少。python实现非正态分布概率密度有关计算原理代码实现实例数据集代码分析原理参考文章正态分布下的累积概率代码实现normal_eval.py(我自己命名的,后面会导入)from scipy import stats# 前提!!!!!数据服从正态分布# 求小于x的概率,即x左侧原创 2020-09-24 23:38:00 · 3351 阅读 · 0 评论 -
python实现决策树的保存和调用
总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树的保存和调用决策树的保存和调用决策树的保存和调用前面讲到将训练的决策树绘制成简单易懂的图片,trees.py下的代码def classify(inputTree, featLabels, testVec): print(featLabels) firstStr = list(inputTree.keys())[0] secondDict = inputTree[firstS原创 2020-09-23 22:07:20 · 2689 阅读 · 0 评论 -
利用python实现决策树图片绘制
总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树绘制treePlotter测试与使用treePlotter东西太多了,懒得看咋实现的了,直接把书上的代码搬过来,修改了几个可能版本问题引起的bug,加了句保存图片的代码,直接拿来用了。treePlotter.py'''Created on Oct 14, 2010@author: Peter Harrington'''import matplotlib.pyplot as pltde原创 2020-09-23 16:36:58 · 2245 阅读 · 1 评论 -
python实现决策树分类(ID3)
总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树分类导入包数据集信息熵计算信息熵分类数据找出使信息熵最少的分类方法导入包import pandas as pdimport numpy as np# trees为自己编写的py文件,放在同一目录,之后有写import treesfrom math import logimport operator数据集No. no surfacing flippers fish1 L1 R1 yes原创 2020-09-23 15:32:23 · 987 阅读 · 0 评论 -
利用python操作word文档
总目录:Python数据分析整理本文代码参考自官方文档:python-docx使用的库下载方式为:pip install python-docx注意!! 不是:pip install docx(为保护公司隐私,已将数据更改为非敏感数据)python操作word文档数据集操作文档最终结果数据集序号 告警名称 告警类别 告警规则1 8ad880857454c47b017472d7d2c926b2+55_1 低危告警 【高空坠物】铁锤从高空坠落 物业找到责任人2 8ad880857454原创 2020-09-22 00:17:04 · 292 阅读 · 0 评论 -
利用python实现K近邻算法
总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战K近邻算法(改进约会网站配对效果)数据集KNN.py数据分析K近邻分类数据集https://www.manning.com/downloads/1108\machinelearninginaction\Ch02\datingTestSet.txt\machinelearninginaction\Ch02\datingTestSet2.txtKNN.pyfrom numpy import *impo原创 2020-09-20 23:32:49 · 2203 阅读 · 0 评论 -
Python实现多元线性回归
总目录:Python数据分析整理本文基本是对文章的整理,修改了一些我这个版本跑不通的地方,多加了一个模型保存部分而已。整理后用于之后使用。原作者大佬文章地址:Python实现多元线性回归Python多元线性回归数据集数据分布数据分析数据拆分数据建模模型保存模型调用数据集TV radio newspaper sales230.1 37.8 69.2 22.144.5 39.3 45.1 10.417.2 45.9 69.3 9.3151.5 41.3 58.5 18.5180.8 1原创 2020-09-20 01:02:46 · 12134 阅读 · 2 评论 -
Python实现一元线性回归
总目录:Python数据分析整理本文基本是对文章的整理,修改了一些我这个版本跑不通的地方,多加了一个模型保存部分而已。整理后用于之后使用。原作者大佬文章地址:Python实现多元线性回归Python一元线性回归数据分析数据拆分数据建模模型保存模型调用数据分析import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pandas import DataFrame, Seriesfrom sklear原创 2020-09-19 19:02:03 · 8944 阅读 · 1 评论 -
Python数据分析整理
Python数据分析整理成都找了份实习工作,之前本来是打算先熟悉下SPSS的使用,但是公司要分析的基本是百万左右的数据,于是边学习边整理下资料吧。所有代码基本都来自网上,我都会注明学习整理的出处,可能由于一些库版本的原因会进行稍加修改,所有代码都是在我的版本下可以跑通的,有不了解的地方可以在下方留言。Python 3.7.6sklearn 0.0pandas 1.0.5matplotlib原创 2020-09-19 18:42:09 · 332 阅读 · 0 评论