- 博客(5)
- 资源 (15)
- 收藏
- 关注
原创 机器学习之初识PCA
一 定义及用途定义:即主成分分析方法,无监督学习方法,是一种使用最广泛的数据降维算法。用途:用于特征降维,通过分析主成分先显出最大的个别差异,发现更便于人类理解的特征;也可以用来削减回归分析和聚类分析中变量的树木二 出现原因在很多场景中对多变量数据进行观测,在一定程度增加数据采集工作量。更重要的是:多变量之间可能存在相关性,从而增加问题分析的复杂性如果对每个指标(特征)单...
2020-04-25 23:07:16 227
原创 机器学习之决策树简析
模型训练算法介绍机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能,在计算机系统中,"经验"通常以"数据"形式存 在,因此机器学习所研究的主要内容是关于在计算机上从数据中产生"模型" (model) 的算法,即"学习算法" (learning algorithm). 有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西...
2020-04-19 22:43:33 374
原创 机器学习之深入逻辑回归
逻辑回归为什么需要逻辑回归线性回归是不能解决分类问题的。线性回归实际上做了三个假设1.因变量Yi和自变量Xi之间呈线性相关2.自变量Xi与干扰项相互独立3.没被线性模型捕捉到的随机因素服务正态分布理论上来说,任何数据放在模型里面都会得到相应的参数估计,进而通过模型对数据进行预测。但是这并一定能保证模型效果,有时会得到”错且无用”的模型,因此建模的过程中需要不断提出假设和检验假设什...
2020-04-12 23:07:39 221
原创 sklearn之线性回归和多项式回归
涉及内容多项式回归多项式的sklearn实现偏差和方差增加算法模型泛化能力的正则化处理多项式回归研究一个因变量与一个或多个自变量(特征)间多项式的回归分析,成为多项式回归(Ploynomial Regression).其为线性回归模型,其回归函数关于回归系数是线性的,自变量x和因变量y之间的关系被建模为n次多项式当自变量只有一个时,成为一元多项式回归;如果自变量(特征)为...
2020-04-05 23:46:16 1794
原创 解决python安装库较慢的方式
将下载的镜像源地址指向国内的地址:清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东理工大学:http:...
2020-04-05 22:45:08 209
Flume 根据字段进行路由插入 ES
2019-04-26
验证码工程源码
2016-11-02
JDBC连接Oralce数据库驱动
2014-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人