python
HKDER
这个作者很懒,什么都没留下…
展开
-
Python运用决策树方法和随机预测一个人的收入水平
一.数据集来源http://archive.ics.uci.edu/ml/datasets/Adult该数据集是美国1994年人口普查数据库,预测任务是确定一个人的年收入是否超过5万美元。该数据集有以下指标,并且有缺失项。二.方法决策树方法和随机森林方法三.步骤要对数据进行处理,删除缺失数据,然后对特征进行赋值,变换成哑变量。举一个例子:Edu值Prescho...原创 2020-02-08 15:18:35 · 2997 阅读 · 0 评论 -
Python多项逻辑回归和线性判别分析识别英文字母
应用多项逻辑回归(Multinomial Logistic Regression, MLR)和线性判别分析((Linear Discriminant Analysis, LDA)来识别英文字母。一.数据集数据集来源:http://archive.ics.uci.edu/ml/datasets/letter+recognition数据集data文件中共有17列20000行,其中第1列是英文字母...原创 2020-01-26 12:04:40 · 1636 阅读 · 0 评论 -
Python不同方法实现手写数字识别结果和代码
一.背景手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。在我们的日常生活中,每天都要进行大量的文档处理工作,比如税单,银行支票,汇款单,信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为个迫切需要解决的问题。另外随着平板电脑和触摸屏手机的普及,手写输入成为了很多人的主要输入方式。手写...原创 2020-01-26 11:19:50 · 3722 阅读 · 1 评论 -
python判断行或列是否有缺失值/统计缺失值数量
1.检查是否有缺失值列:data.isnull().any()print(data.isnull().any())false无缺失值/true有缺失值结果例样:age falsename falseschool trueschool的这一列有缺失值,其他列无缺失值。行:data.isnull().any(axis=1)print(data.isnull().any(axi...原创 2019-09-13 19:39:18 · 38569 阅读 · 0 评论 -
Python——describe函数值输出含义/分位值的计算和含义
describe函数输出含义NA数据已经删除in:print(adult["Hours-per-week"].describe())#输出每周工作的小时总量output:count:总数mean:平均值std:方差min:最小值25%:25%分位数50%:50%分位数75%:75%分位数max:最大值Name:名字dtype:数据类型分位值:25%分位值对应4...原创 2019-09-15 15:04:18 · 8244 阅读 · 1 评论 -
Python——matplotlib模块构造箱型图检测异常值
一.箱型图通俗来讲,就是将所有的数据都分布在这张图上,矩形上下限用四分为值,又用四分位值算出一个上界和下界,大于上界或者小于下界的值就是异常值。这里四分位距(IQR)就是上四分位与下四分位的差值。我们通过四分位距的1.5倍为标准,上界:超过上四分位+1.5倍IQR距离,下界:下四分位-1.5倍IQR距离的点为异常值。分位值的定义和计算在这里:(https://blog.csdn.net/cr...原创 2019-09-18 11:21:54 · 5130 阅读 · 1 评论 -
Python蒙特·卡罗方法和Q-Q plot验证中心极限定理
一.蒙特卡罗方法蒙特卡洛的基本原理简单描述是先大量模拟,然后计算一个事件发生的次数,再通过这个发生次数除以总模拟次数,得到想要的结果,精髓就是:用统计结果去计算频率,从而得到真实值的近似值。蒙特卡洛方法可以应用在很多场合,但求的是近似解,在模拟样本数越大的情况下,越接近与真实值,但样本数增加会带来计算量的大幅上升。不理解的话请戳:https://blog.csdn.net/crj0926/a...原创 2019-09-21 19:23:49 · 2910 阅读 · 0 评论