自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 网络信息整合的几个关键点

信息整合系统要求对互联网中的各种优质资源进行分类整合,并提供灵活的分类分片检索功能,是一项非常庞大的项目。本文根据道道合项目负责人温丙磊的介绍,对其中的几种重要的技术,做一下介绍。1:网页信息抽取技术因为要对网络中各种各样的网页进行信息整合,并且要提供不同类型数据的筛选,排序等功能。例如,对于购物信息,要精准的获取不同购物网站网页的价格、折扣、评论数目等信息,而对于不同招聘网站的网

2013-06-12 20:54:08 703

原创 UCI网页信息抽取技术

UCI网页信息抽取技术,是一种适用于亿级数量的智能网页信息抽取技术,主要适用于互联网信息整合和搜索引擎中网页信息的提取。该项技术采取的是标识提取,即操作人员只需在网页中标识一下要提取的内容即可。操作便捷,维护简单,准确率高,所以非常适用于超大规模的网页提取。其主要特点有:  1:操作便捷:不使用网页代码,只需在需要提取的内容处做标识即可。  2:准确率高:采用标识自动定位技术,即使

2013-06-12 20:52:23 655

原创 网络信息整合的几个关键点

信息整合系统要求对互联网中的各种优质资源进行分类整合,并提供灵活的分类分片检索功能,是一项非常庞大的项目。本文根据道道合项目负责人温丙磊的介绍,对其中的几种重要的技术,做一下介绍。1:网页信息抽取技术因为要对网络中各种各样的网页进行信息整合,并且要提供不同类型数据的筛选,排序等功能。例如,对于购物信息,要精准的获取不同购物网站网页的价格、折扣、评论数目等信息,而对于不同招聘网站的网

2013-06-12 20:50:30 703

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除