自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二(转载)

原文地址:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html免责声明:此语料库仅供自然语言处理的业余爱好者研究和交流,禁止用于任何商业用途(包括在资源内部链接广告等行为)。感谢网易新闻中心、腾讯新闻中心、凤凰新闻中心以及新浪新闻中心提供新闻素材。新闻著作权归以上网站所有,任何人未经上述公司允许不得抄袭。...

2010-10-04 13:52:20 198

原创 献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之一(转载)

原文地址:http://www.cnblogs.com/finallyliuyu/archive/2010/09/10/1823676.html  题记:    做研究,尤其是基于统计学方法的研究,常常需要大量的训练数据。详细这些东西在读研究生不难得到。在自然语言处理公司工作的工作人员也不难得到。但是这些东西属于机密,实验室和公司是不会轻易外传的。所以对于业余的爱好者来说,比如园子...

2010-10-04 13:50:09 340

原创 大数据量,海量数据 处理方法总结(转载)

转载,原文地址:http://blog.sina.com.cn/s/blog_4d3a41f40100ic9d.html 不错。原文地址:大数据量,海量数据 处理方法总结(转载)作者:秋金遇水 (此转载地址现博文加密,无法看到了~)最近有点忙,稍微空闲下来,发篇总结贴。大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及...

2010-09-01 10:38:51 137

Nutch0.9安装指南

 终于!我把Nutch0.9的安装文档贴出来了首先提醒的是,按照这个步骤做还是会遇到各种莫名奇妙的问题,没关系,按照步骤查找,一定有地方出错了,从出错的地方重新做吧。(连我自己每次重新安装的时候还是会遇到各种问题,所以过程一定要细心啊!)   直接上过程:1、首先,我的配置:JDK1.6,Tomcat6.0,Nutch0.92、添加JAVA_HOME和CATALINA_HO...

2010-06-07 20:38:24 246 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除