自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (5)
  • 收藏
  • 关注

空空如也

金油条网页正文提取器.Net组件1.0

该组件包括一个开发用的DLL,用.net编写,里面有一个asp.net的DEMO文件(这个是时隔去年DEMO发布后的1年才发布,但是和1年前版本是一样的,新版本暂不予发布)。 大家可以在非商业用途使用。 金油条正文提取器是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。 最新版本和在线演示。详见: http://www.shoula.net/ParseContent 如果要最新版本,或者对这个感兴趣的。 可以和我联系或者加入 QQ群:50453294. QQ:6782435 金油条

2009-09-01

金油条网页采集器

web 油条 网页 蜘蛛 采集

2008-06-02

油条桌面知识检索系统企业版 0.9beta

具有从指定的监听目录里面搜索符合基本扩展名的文件,并且把搜索的文件的内容建立索引。从而可以全速的进行检索。帮助你管理本地硬盘上的知识。现在可以索引大部分文档。比如:word,excel,ppt,txt,pdf,html,以及各类文本文件。 具有文件内容察看器,可以不打开文件察看文件的内容。现在支持:word,excel,ppt,txt,pdf,html等文件。 文件抽取和百度桌面兼容,如果你要支持更多的文件类型,你可以到百度桌面搜索下载插件安装, 地址如下: http://disk.baidu.com/plug-ins/main/list.php 服务器版能够为企业建立快捷方便的知识管理。

2008-12-30

金油条网页正文提取器

该DEMO文件是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。 最新版本和在线演示。详见: http://www.shoula.net/ParseContent 如果要最新版本,或者对这个感兴趣的。 可以和我联系或者加入 QQ群:50453294. QQ:6782435 金油条

2008-08-03

金油条网页正文提取器1.0

该DEMO文件是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。 最新版本和在线演示。详见: http://www.shoula.net/ParseContent 如果要最新版本,或者对这个感兴趣的。 可以和我联系或者加入 QQ群:50453294. QQ:6782435 金油条

2008-08-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除