- 博客(8)
- 资源 (41)
- 收藏
- 关注
原创 基于CRF的中文分词
CRF简介 Conditional Random Field:条件随机场,一种机器学习技术(模型) CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如: 分词(标注字的词位信息,由字构词)词性标注(标注分词的词性,例如:名词,动词,助词)命名实体识别(识别人名,地名,机构名,商品名等具有一定内在规律的实体名词)
2012-05-25 16:44:01 2152
原创 机器学习是什么--周志华
机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。 不少人其实并没有真正想过,这是不是自己喜欢搞的东西,只不过看见别人都在搞,觉着跟大伙儿走总不会吃亏吧。 问题是,真有个“大伙儿”吗?就不会是“两伙儿”、“三伙儿”?如果有“几伙儿”,那到底该跟着“哪伙儿”走呢? 很多人可能没有意识到,所谓的machine learning community,现在至少包含了两个有着完全
2012-05-25 16:33:33 6065
原创 LibSVM学习(三)——LibSVM使用规范
转自:http://blog.csdn.net/flydreamgg/article/details/4468995 其实,这部分写也是多余,google一下“libsvm使用”,就会N多的资源,但是,为了让你少费点心,在这里就简单的介绍一下,有不清楚的只有动动你的mouse了。需要说明的是,2.89版本以前,都是svmscale、svmtrain和svmpredict,最新的是s
2012-05-25 11:31:29 1542
原创 开源SVM库libSVM介绍
libSVM是台湾大学林智仁教授等研究人员开发的一个用于支持向量机分类,回归分析及分布估计的c/c++开源库。另外,它也可以用于解决多类分类问题。 libSVM最新的版本是2011年4月发布的3.1版。林智仁教授设计开发该SVM库的目的是为了让其它非专业人士可以更加方便快捷的使用SVM这个统计学习工具。libSVM提供了一些简单易用的接口,从而使得用户可以方便的使用,而不必关心其内部复杂的数学模型
2012-05-25 10:32:31 1515
原创 汉字拼音对照库
[转自]http://blog.csdn.net/qiujiahao/article/details/5057145 在项目中需要实现用户输入拼音就能查找到汉字的功能,在网上搜索了一下汉字和对应的拼音的库,发现很少,找到的几个收录的汉字也就几千个常用字。所以自己收集整理了一个。希望对大家有帮助。 我提供的这个库是我自己收录的,共计2万多个汉字。我以文本文件的方式共享给大家。 文本文件中的内容
2012-05-23 10:02:15 2788
原创 依存语法:从短语结构树转换为依存树
依存语法:从短语结构树转换为依存树 冯志伟 与短语结构语法比较起来,依存语法没有词组这个层次,每一个结点都与句子中的单词相对应,它能直接处理句子中词与词之间的关系,而结点数目大大减少了,便于直接标注词性,具有简明清晰的长处。特别在语料库文本的自动标注中,使用起
2012-05-22 16:25:42 10710
原创 让谷歌感到害怕的12家新创公司:Quora居首
北京时间5月17日消息,据国外媒体报道,谷歌现在处于相当不错的位置。一方面在搜索市场上大幅领先,是最好的搜索引擎,另外一方面还进入其他领域,如支付和音乐。 但这些市场被搅动的时机已经成熟,所需的只是新创公司如何将谷歌赶下神坛的想法--谷歌无法像灵活的新创公司一样行动迅速。当询问一些投资者和业内人士,他们认为谷歌哪些地方可能处于被干扰的危险之中时,他们的回答显示,谷歌比我们想象的要脆弱得多。 甚
2012-05-17 09:27:08 3735
原创 数据分析领域新星DataSift融资1500万美元
北京时间5月3日早间消息,据TheNextWeb报道,数据分析行业后起之秀DataSift近日完成新一轮融资,此次融资金额为720万美元。本次融资主要来自一直支持DataSift的GRP Partners和IA Ventures两家公司,据悉此次投资将会主要用于拓展DataSift全球市场占有率及提升其服务质量。 DataSift是创建于英国的一家企业,但创建之后很快就搬到了旧金山。在此之前
2012-05-04 09:55:12 2710
OpenRS— 开放式遥感数据处理与服务平台资料
2009-06-19
TinyXML解析xml文档
2008-12-29
Web+Services发布与调用(axis,xfire).doc
2008-12-27
COM+ Services.doc
2008-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人