机器学习
西海岸看日出
东北大学
展开
-
机器学习之推荐系统
一、什么是推荐系统?我们每天都在有意识无意识接触推荐系统,比如:一种数学定义为:设C为全体用户集合;设S为全部商品/推荐内容集合;设u是评判把si推荐给ci的好坏评判函数;推荐是对于c∈C,找到s∈S,使得u最大,即部分场景下是Top N的推荐,即不止推荐一个si,把多个感兴趣的si做排序推荐给用户。...原创 2019-04-10 11:31:51 · 3394 阅读 · 22 评论 -
机器学习之聚类算法
聚类是一种非监督式学习算法,它不要求源数据集有标签,一般应用于做数据探索性分析,聚类算法的结果是将不同的数据集按照各自的典型特征分成不同类别,不同人对聚类的结果解读可能不同。总体上来说,聚类算法分为层次聚类(Hierachical Methods)和划分聚类(Partitioning Methods)。一、层次聚类层次聚类不需要指定类数,按策略不同可分为自底向上的聚类方法(agglomera...原创 2019-04-15 22:05:00 · 937 阅读 · 0 评论 -
机器学习之CTR预估
一、什么是CTR预估通俗来说,CTR就是一个商品广告点击率的大小,公式为:其中,Impressions为该广告一共推送出去的次数,Clicks为用户点击该广告的次数。进行CTR预估,就可以知道某些商品有没有必要打广告,打广告的效益高不高,这样可以节约商家的广告成本。CTR预估和很多因素相关,比如历史点击率、广告位置、内容、时间、用户等。...原创 2019-04-15 22:08:14 · 1307 阅读 · 0 评论 -
机器学习之采样与变分
一、采样基于采样的推理算法利用的思想是:概率 = 大样本下频率。故在获得图模型以及CPD的基础上,通过设计采样算法模拟事件发生过程,即可获得一系列事件(联合概率质量函数)的频率,从而达到推论的目的。(算不出来就估计一下,可以求先验概率)1、马尔科夫链在介绍采样算法之前先介绍下马尔科夫链的原理。假设天气服从马尔科夫链:则转移矩阵P=(0.9,0.1;0.5,0.5)那么从今天(假设是晴)...原创 2019-04-22 20:22:48 · 574 阅读 · 1 评论 -
机器学习之人工神经网络
一、神经网络是什么?神经网络结构大概如下:最基本的神经网络由输入层,隐含层和输出层构成,给定输入量,就能得到一组输出结果。逻辑回归可以看作是一个只有输入层和输出层的简单神经网络,从逻辑回归到神经元(感知器)的过程如下:其中g(z)为sigmoid函数,在神经网络中叫做激活函数或者连接函数,起到归一化的作用。在上述神经元(感知器)的基础上,添加少量隐含层,就得到了浅层神经网络,如下:...原创 2019-04-23 21:03:37 · 1204 阅读 · 0 评论 -
机器学习之概率图模型(贝叶斯概率,隐马尔科夫模型)
一、贝叶斯公式在学习概率图模型之前先要了解贝叶斯公式:由公式(1),(2)可得:这便是贝叶斯公式,其中条件概率P(B/A),P(A/B)称为后验概率,概率P(A),P(B)称为先验概率。即我们在已知条件概率P(B/A)和概率P(A),P(B)的情况下,可以计算出条件概率P(A/B)。由于已知公式:将贝叶斯公式中的P(B)替换得:...原创 2019-04-20 13:05:46 · 2237 阅读 · 0 评论 -
采用OpenCv的traincascade.exe来训练自己的分类器,用于目标的检测
opencv中有两个函数可以训练分类器opencv_haartraining.exe和opencv_traincascade.exe,前者只能训练haar特征,后者可以用HAAR、LBP和HOG特征训练分类器。这两个函数都可以在opencv\build\x86\vc10\bin文件夹下找到。opencv_traincascade.exe训练的是adaboost的级联分类器,这里不讲adaboost...原创 2019-06-18 21:05:28 · 2708 阅读 · 2 评论 -
SVM分类器如何输出预测实例的概率值
支持向量机分类器能够输出测试实例与决策边界之间的距离,你可以将其用作信心分数。但是这个分数不能直接转化成类别概率的估算。如果创建SVM时,在Scikit-Learn中设置probability=True,那么训练完成后,算法将使用逻辑回归对SVM分数进行校准(对训练数据额外进行5-折交叉验证的训练),从而得到概率值。 这会给SVM添加predict_proba()和predict_log_prob...原创 2019-07-18 15:40:40 · 21118 阅读 · 6 评论