具体的概念请参考https://www.zhihu.com/question/24627666
在这里只给出精髓:
1:我来给你个有触感的例子。
假设我们的任务是要预测那些微博可以上微博热搜榜。
有两个离散特征,一个代表某个微博里有“鹿晗”,一个代表某个微博里有“关晓彤”
两个特征单独看热度都一般,此时我们用二阶多项式核方法:
这个核函数可以把二维空间投射到三维空间,展开之后是:
这样就把二维特征变成了三维,多了一维 ,代表着某条微博里鹿晗和关晓彤同时出现。
结果大家都知道了,鹿晗关晓彤同时出现的那条微博超级火,把新浪服务器都挤爆了。
2:核函数的作用就是隐含着一个从低维空间到高维空间的映射,而这个映射可以把低维空间中线性不可分的两类点变成线性可分的。