机器学习
math_computer
一个热爱数学和雨点的嗯,还没想好是什么
展开
-
采样方法调研
目录参考动机函数变换拒绝采样重要性采样蒙特卡洛采样MH采样算法Gibbs采样算法参考采样在特征学习中是重要的:论述采样在特征学习中的重要性,有实验证明机器学习采样方法大全采样方法(Sampling Method)不错的讲义:以下基础部分主要参考这个文献蒙特卡洛采样:蒙特卡洛采样基础参考这部分Machine Learning_ A Probabilistic Perspective:...原创 2020-03-24 17:12:13 · 306 阅读 · 0 评论 -
机器学习算法选择策略
参考:https://blog.csdn.net/zyxhangiian123456789/article/details/88182016原创 2019-12-19 18:36:14 · 203 阅读 · 0 评论 -
随机森林
参考:调参https://www.cnblogs.com/pinard/p/6160412.html?utm_source=itdadao&utm_medium=referral原创 2019-11-21 20:04:53 · 94 阅读 · 0 评论 -
决策树
参考:https://blog.csdn.net/mn_kw/article/details/79913786https://blog.csdn.net/weixin_37051000/article/details/78587370决策树给出的特征Gini重要性计算:https://blog.csdn.net/DKY10/article/details/84843864,https://...原创 2019-10-15 15:02:43 · 201 阅读 · 0 评论 -
k均值聚类算法
步骤1.随机选择k个初始点作为聚类中心2.将数据中每个对象赋予给最近的聚类中心3.每一类数据求取质心,作为新的聚类中心4.重复2和3,直到满足结束条件(迭代步数或者最终的聚类中心变化较小或者误差平方和变化较小)注意:1.这里初始化是随机的,这会导致局部最优解,可以通过不断地做2均值聚类来提高性能,这是二分k均值算法,每次选择聚类后误差平方和最小的方式做2均值聚类 ...原创 2019-09-13 17:47:04 · 686 阅读 · 0 评论 -
kNN分类器
参考:https://www.cnblogs.com/bigmonkey/p/7387943.html原理给定一个多标签分类问题。有一些已知标签的数据,然后对未知对象打标签。k均值算法基于这样的假设:(1)距离越近的对象标签相同的概率越大,(2)对象标签分布具有局部一致性既然局部是一致的,那么就用距离未知对象最近的k个已知对象的标签给出的分布的众数作为预测类别标签。注意:1.在算距离...原创 2019-09-12 19:51:17 · 547 阅读 · 0 评论 -
机器学习分类指标——备忘表
考虑一个二分类的情况,类别为1和0,我们将1和0分别作为正类(positive)和负类(negative),则实际分类的结果有4种,表格如下:特异度(sensitivity):负例的召回率(所有没病的人中被诊断为没病的比例)敏感度(specificity):正例的召回率(所有有病的人中被诊断为有病的比例)假阳率(误诊率):假阳占全部负例的比例(所有没病的人种被诊断为有病...原创 2019-09-12 11:13:48 · 678 阅读 · 0 评论 -
基于协同过滤的推荐引擎
参考:https://blog.csdn.net/pipisorry/article/details/51788955基于物品的协同过滤关键点:基于物品之间的相似度,进行加权平均得到所求评分。(1)相似度计算:对于电影1和电影m之间的相似度sim(1,m),可以使用这两个电影的共同用户给出的评分向量之间的皮尔逊相似系数进行度量。(2)预测打分:根据用户5已经给出的打分,做一...原创 2019-09-09 21:05:21 · 125 阅读 · 0 评论