机器学习
文章平均质量分 94
你再翻一页就好了
reguler
展开
-
监督学习方法
1;广义线性模型:2;对数几率回归数几率函数:y=11+e−xy=\frac{1}{1+e^{-x}}y=1+e−x1(2.1),对数几率函数是一种"Sigmoid函数",它将z值转化为0或1的yyy值,将此函数作为g−(.)g^-(.)g−(.)将yyy视为样本xxx作为正例的可能性,对几率取对数则得到“对数几率”,lny1−yln\frac{y}{1-y}ln1−yy. (2.2).此处xxx为样本xxx,预测实际是去逼近真实值,其对应的模型为"对数几率回归",公式2.1的yyy视为后原创 2021-06-04 00:33:47 · 354 阅读 · 0 评论 -
CART决策树回归
不同于分类决策树,回归决策树返回预测值原创 2020-08-01 14:31:05 · 424 阅读 · 0 评论 -
聚类分析基础-相似度计算
相似性:1;二元变量对于二元变量,我们通常比较为1的数据占比比例,对于为0的一般不比较相似性,因为没有目标特征的样本其差异无法判断。2;标量对只有大小,没有方向的两个样本,用欧几里何距离:e.g:y=(1,4,6),x=(3,5,120)e.g:y=(1,4,6),x=(3,5,120)e.g:y=(1,4,6),x=(3,5,120),则两样本之间的相似性为d=(1−3)2+(4−5)2+(6−120)2d = (1-3)^2+(4-5)^2+(6-120)^2d=(1−3)2+(4−5)2+(6原创 2020-07-10 18:09:15 · 3529 阅读 · 0 评论 -
学习器利用错误率性能比较检验方法
比较检验是为了对机器学习器性能值进行评估的方法:一般的我们都有F1-score值,ROC值如果进行泛化比较,一般含有不同样本值、样本大小和重复测试都会造成最终性能度量值的不同。所以要寻求新的检验方法:hypothesis test提供了,前提:测试集观察结果A如果优于B,则A的泛化性能在统计意义上是否也会优于B,以及这个结论的把握程度(置信度),性能度量指标为∈一:假设检验(两种)假设检...原创 2020-05-08 15:56:12 · 902 阅读 · 0 评论