机器学习
文章平均质量分 69
liuchongee
这个作者很懒,什么都没留下…
展开
-
支持向量机SVM算法原理笔记1
最近在学习李航编写的《统计学习方法》一书,看到SVM这一章时遇到了一些困难,在翻阅很多资料之后对其有了一定的理解,所以打算写篇博客来记录一下,后面如果有时间也会把前面几章中的算法加以整理。在看这本书的同时大多加以参考hankcs在码农场中所写的机器学习系列文章,写的很不错,有理论分析也有代码实现,很适合机器学习入门者学习和理解。《统计学习方法》里讲述的太过理论化,假如很多东西我们直接当作已知定理去用原创 2016-07-12 18:08:01 · 2584 阅读 · 0 评论 -
支持向量机SVM算法原理笔记2
上篇博客介绍了当样本集是线性可分情况下的SVM算法原理。接下来介绍不存在一个划分超平面可以正确分类的问题,比如说“异或问题”。 对于此类问题,可以将样本空间映射到更高维度空间,这样映射后的样本就线性可分了。如{(0,+1),(1,-1),(2,+1)}三个点在一位平面内是不可分的,但是映射到二维平面中{(0,0,+1),(1,1,-1),(2,0,+1)}三个点是线性可分的等等。 令φ(x)表示原创 2016-07-14 12:03:51 · 1747 阅读 · 0 评论 -
基于CHI/TFIDT/贝叶斯方法的网页分类器
首先说一下思路,第一步是下载搜狗的新闻分类训练数据集,然后是使用结巴中文分词工具对文本进行处理,并去停用词得到所有文本中出现的词语。第三步是使用CHI作为特征选择的依据给每一类新闻选出150维的特征,并去重。这样我们就可以获得大概1000维的特征。有了特征之后就是为每个新闻构造VSM模型,即使用TFIDF方法计算各特征的权重得到表示该文本的特征向量。这样一来,我们就将原本的新闻文章转化成了(1000原创 2016-08-14 14:12:03 · 7112 阅读 · 1 评论 -
斯坦福CS231n 课程学习笔记--线性分类器(Assignment1代码实现)
最近学习了斯坦福的CS231n(winter 2016)系列课程,收获很大,作为深度学习以及卷积神经网络学习的入门很是完美。学习过程中,主要参考了知乎上几位同学的课程翻译,做得很好,在这里也对他们表示感谢,跟课程相关的很多资源都可以在该专栏中找到。推荐大家把每个笔记的翻译都完整的看一下。关于该课程视频的中文字幕也在翻译进行中,目前第一集已经翻译完成,感兴趣的同学可以也可以看看参与进去。此外,完成课程原创 2016-09-25 12:15:21 · 3343 阅读 · 2 评论 -
斯坦福CS231n 课程学习笔记--线性分类器(笔记篇)
最近学习了斯坦福的CS231n(winter 2016)系列课程,收获很大,作为深度学习以及卷积神经网络学习的入门很是完美。学习过程中,主要参考了知乎上几位同学的课程翻译,做得很好,在这里也对他们表示感谢,跟课程相关的很多资源都可以在该专栏中找到。推荐大家把每个笔记的翻译都完整的看一下。关于该课程视频的中文字幕也在翻译进行中,目前第一集已经翻译完成,感兴趣的同学可以也可以看看参与进去。此外,完成课程原创 2016-09-23 20:04:44 · 4366 阅读 · 2 评论