数据挖掘算法
文章平均质量分 95
林立民爱洗澡
这个作者很懒,什么都没留下…
展开
-
C4.5 决策树算法对UCI wine数据集分类的实现(MATLAB)
1、功能实现与样本分析在数据挖掘领域,可以利用相应的算法对数据集进行训练,即对样本的特征进行分析,从而归纳出相同类别的样本之间存在的内在特征联系,进一步对未知类别的样本进行预测,判断出该样本所属的类别。本文实现了利用决策树算法对UCI 机器学习库上的经典wine数据集进行分类的目的。为达到相应的分类目的,需要先对数据集样本进行分析。表1 wine数据集样本特征不用化学成分的含量与酒的所属类别息息...原创 2018-07-11 14:18:13 · 16975 阅读 · 23 评论 -
详解EM算法与混合高斯模型(Gaussian mixture model, GMM)
最近在看晓川老(shi)师(shu)的博士论文,接触了混合高斯模型(Gaussian mixture model, GMM)和EM(Expectation Maximization)算法,不禁被论文中庞大的数学公式所吓退。本文通过查阅相关资料,在复杂巧妙的推理公式中融入了自己的理解,详细梳理了混合高斯模型和EM算法。1 单高斯模型(Gaussian single model, GSM)...原创 2018-07-14 23:00:34 · 150683 阅读 · 107 评论 -
关于支持向量机(SVM)的高斯核和惩罚因子C的理解(简单易懂)
跟小伙伴探讨了线性支持向量机(Support Vector Machine, SVM),不自觉地就将话题拉向了高斯核函数和惩罚因子C。本文用简单易懂的形式呈现了自己对于高斯核函数和惩罚因子C的理解。为什么说高斯核对应的映射函数将原始特征空间映射成了无限维空间?高斯核函数的参数σσ\sigma 如何选择?惩罚因子C的加入有何意义?C的取值大小对于SVM的模型有何影响?后文将围绕这几个问题进行探讨...原创 2018-07-20 19:13:02 · 35226 阅读 · 11 评论 -
动态时间规整算法(Dynamic Time Warping, DTW)之初探单词语音识别
动态时间规整算法(DTW)是最近接触的一种提取时间序列模板方法。本文主要是一些自己的学习记录,并适当地加入自己的理解。若有见解不一致之处,欢迎交流。1 动态时间规整(DTW)基本思想 先从单词语音时间序列的规整问题引入DTW的基本思想。 假设下图两个时间序列对应的是同一个单词的发音(实则不是,只是为了便于理解)。黑色的线表示两个时间序列的相似的点(用幅度差异刻画时间序列点的相似...原创 2018-07-27 17:28:47 · 14093 阅读 · 1 评论 -
机器学习的一些总结
  以下是自己在机器学习课程中的一些知识点总结,主要渗透了自己对某些知识点的理解,涵盖的面较广,将会不定期地更新。若有理解不一致之处,望指明并相互探讨。1 SVM中常用的核函数有哪些?如何选择相应的核函数?  常用的核函数有线性核,多项式核以及高斯核。1.1 线性核κ(x,z)=&amp原创 2018-10-05 21:58:15 · 1124 阅读 · 0 评论