机器学习
Marinaaaaa
这个作者很懒,什么都没留下…
展开
-
监督学习——决策树
熵化学中可定义为分子的混乱程度,这里可以理解为系统的不确定程度例如:A{1,2,3,4,5},B{1,1,1,1,1}对于A集合,每个数字发生的概率均为1/6,Pi较小,-Pi*lnPi较大,熵值较大。对于B集合,1发生的概率为1,熵值较小。...原创 2019-08-23 17:17:36 · 620 阅读 · 0 评论 -
监督学习——多变量线性回归实例:GAD7焦虑症程度预测(python sklearn实现+spss modeler实现)
项目目的:熟悉数据分析项目流程,完成焦虑症数据GAD7数据分析项目材料:数据表GAD7.xlsx、数据说明GAD7.json我们选取两个特征变量:受教育程度及年薪。目标变量:焦虑症程度。受教育程度可选选项0-6依次为小学,中学,高中,大学专科,大学本科,硕士研究生,博士研究生。年薪可选选项0-5依次为0-4万,5-10万,11-20万,21-40万,41-80万,超过80万。焦虑症程度0...原创 2019-08-12 00:22:59 · 1303 阅读 · 0 评论 -
监督学习——多变量线性回归(梯度下降算法)
一、多维特征例子:x(2)=$$\left[\begin{matrix}1612\3 \2 \40\end{matrix}二、梯度下降算法三、梯度下降算法实践1—特征缩放四、梯度下降算法实践2—学习率五、特征和多项式回归六、z...原创 2019-08-10 14:59:01 · 703 阅读 · 0 评论 -
监督学习——单变量线性回归(梯度下降算法)
一、模型表示例子:预测住房价格数据集包含俄勒冈州波特兰市的住房价格。根据不同房屋尺寸所售出的价格,画出我的数据集。如果你朋友的房子是 1250 平方尺大小,你要告诉他们这房子能卖多少钱。那么,你可以做的一件事就是构建一个模型,也许是条直线,从这个数据模型上来看,也许你可以告诉你的朋友,他能以大约 220000(美元)左右的价格卖掉这个房子。假使我们回归问题的训练集(Training Set)...原创 2019-08-09 01:27:09 · 780 阅读 · 0 评论 -
监督学习——随机森林
一、随机森林原理如何构建随机森林?有两个方面:1.数据的随机性化2.待选特征的随机化使得随机森林中的决策树都能够彼此不同,提升系统的多样性,从而提升分类性能。数据的随机性化:使得随机森林中的决策树更普遍化一点,适合更多的场景(有放回的准确性在:70%以上,无放回的准确率在:60%以上)1.采用有放回的抽样方式构建子数据集,保证不同子集之间的数量级一样2.利用子数据集来构建子决策树...原创 2019-08-29 00:31:19 · 2114 阅读 · 0 评论