在优质/劣质站点二分问题中,百度采用了SVM模型。SVM是一种基于判别式的机器学习模型。原理:对于一个二分类问题,例如优质站点和劣质站点,SVM的目标就是寻找到一个多维空间中的超平面,使得不同类别的实例尽可能被这个超平面正确地分开,并且超平面到它两侧最近实例的距离(称作边缘)尽可能大。
[img]http://dl.iteye.com/upload/attachment/462178/82499347-927c-3a97-8215-4cb36d533a64.gif[/img]
站点在SVM模型下的判别示意图
[img]http://dl.iteye.com/upload/attachment/462178/82499347-927c-3a97-8215-4cb36d533a64.gif[/img]
站点在SVM模型下的判别示意图