自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (3)
  • 收藏
  • 关注

原创 压缩的学习1

  0.  为什么需要压缩?               数据存储的需要:像google、baidu这样的搜索引擎公司,需要大量的存储设备来保存spider down的网页;如果不压缩的话,呵呵,结果可想而知。               网络传输的需要:传输1T的数据与传输100GB的数据相比,所耗的时间显而易见。1. 为什么可以压缩?               数据的

2009-03-22 20:47:00 733

ICTPOS3.0汉语词性标记集

计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;

2014-09-04

搜索引擎应用技术--cache技术

搜索引擎应用技术-cache技术,hash算法

2009-02-28

Data Compression Using Long Common Strings

Compression Using Long Common Strings

2009-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除