☆机器学习与数据挖掘☆
文章平均质量分 60
核动力蜗牛Killua
http://blog.yidooo.net/
展开
-
机器学习 支持向量机(SVM)
SVM方法的基本思想是:定义最优线性超平面,并把寻找最优线性超平面的算法归结为求解一个凸规划问题。进而基于Mercer核展开定理,通过非线性映射φ,把样本空间映射到一个高维乃至于无穷维的特征空间(Hilbert空间),使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。 使用工具: 1) Libsvm:http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 2) python:版本为2.6.x或2.7都可以 3)原创 2010-10-23 18:38:00 · 1183 阅读 · 0 评论 -
中文语料库整理
中文自然语言处理开放平台 由中国科学院计算技术研究所·数字化室&软件室创立一个研究自然语言处理的一个平台,里面包含有大量的训练测试语料。 语料库: http://www.nlp.org.cn/docs/doclist.php?cat_id=9&type=15 文本语料库: http://www.nlp.org.cn/docs/doclist.php?cat_id=16&type=15原创 2012-06-15 12:46:53 · 7714 阅读 · 2 评论 -
英文语料库整理
Reuters-21578 语料下载 Reuters-21578中文说明 Reuters-21578 语料库SGML转txt脚本(Python) Reuters-21578 语料库SGML转txt脚本(ruby) 常用英文语料库下载 本语料库由University of California整理,里面包含20newsgroups,reuters21原创 2012-06-15 12:44:30 · 4521 阅读 · 2 评论