python
数据统计分析与挖掘
这个作者很懒,什么都没留下…
展开
-
随机森林---代码下载
随机森林(集成算法中最简单的,模型融合算法)随机森林如何缓解决策树的过拟合问题,又能提高精度?a. Random Forest, 本质上是多个算法平等的聚集在一起。每个单个的决策树,都是随机生成的训练集(行),随机生成的特征集(列),来进行训练而得到的。b. 随机性的引入使得随机森林不容易陷入过拟合,具有很好的抗噪能力,有效的缓解了单棵决策树的过拟合问题。c. 每一颗决策树训练样本...原创 2020-03-12 17:41:39 · 302 阅读 · 0 评论 -
决策树---代码下载
决策树(有监督算法,概率算法)a. 只接受离散特征,属于分类决策树。b. 条件熵的计算 H(Label |某个特征) 这个条件熵反映了在知道该特征时,标签的混乱程度,可以帮助我们选择特征,选择下一步的决策树的节点。c. Gini和entropy的效果没有大的差别,在scikit learn中默认用Gini是因为Gini指数不需要求对数,计算量少。d. 把熵用到了集合上,把集合看成随...原创 2020-03-12 17:40:31 · 176 阅读 · 0 评论 -
SVM(Support Vector Machine)支持向量机 ----代码下载
SVM(Support Vector Machine)支持向量机a. SVM算法是介于简单算法和神经网络之间的最好的算法。b. 只通过几个支持向量就确定了超平面,说明它不在乎细枝末节,所以不容易过拟合,但不能确保一定不会过拟合。可以处理复杂的非线性问题。c. 高斯核函数d. 缺点:计算量大搜索公共号“数据统计分析与挖掘”或扫描二维码,在公众号中回复“资源”,获取...原创 2020-03-12 17:39:27 · 211 阅读 · 0 评论 -
决策树模型----代码下载
搜索公共号“数据统计分析与挖掘”或扫描二维码,在公众号中回复“资源”,获取所需资源。原创 2020-03-12 17:37:33 · 170 阅读 · 0 评论 -
多变量自回归模型MATLAB代码实现----下载
搜索公共号“数据统计分析与挖掘”或扫描二维码,在公众号中回复“资源”,获取所需资源。原创 2020-03-12 17:36:47 · 2721 阅读 · 0 评论 -
数据挖掘中的十大经典算法---下载
数据挖掘十大算法----下载数据挖掘十大算法,来自2006年数据挖掘大会搜索公共号“数据统计分析与挖掘”或扫描二维码,在公众号中回复“资源”,获取所需资源。...原创 2020-03-12 17:29:41 · 151 阅读 · 0 评论 -
数据挖掘十大算法代码----下载
数据挖掘十大算法代码----下载数据挖掘十大算法,来自2006年数据挖掘大会搜索公共号“数据统计分析与挖掘”或扫描二维码,在公众号中回复“代码”,获取所需代码数据。...原创 2020-03-12 17:26:51 · 328 阅读 · 0 评论 -
BP神经网络回归预测模型(python实现)
神经网络模型一般用来做分类,回归预测模型不常见,本文基于一个用来分类的BP神经网络,对它进行修改,实现了一个回归模型,用来做室内定位。模型主要变化是去掉了第三层的非线性转换,或者说把非线性激活函数Sigmoid换成f(x)=x函数。这样做的主要原因是Sigmoid函数的输出范围太小,在0-1之间,而回归模型的输出范围较大。模型修改如下:公共号“数据统计分析与挖掘”中回复“数据”,获取本文所需数...转载 2019-10-03 20:35:10 · 20347 阅读 · 1 评论 -
python安装pip、numpy、scipy、statsmodels、pandas、matplotlib等
1、安装python2、安装numpy(开源的数值计算扩展,可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多。 很多库都是以此库为依赖库的,所以特别重要。最常用的是它的数组功能,numpy.array([,,,,,]))首先cmd下跳到C:\Python27\Scripts\easy_install.exe pip ,...转载 2019-09-13 22:04:34 · 795 阅读 · 0 评论