- 博客(0)
- 资源 (5)
- 收藏
- 关注
金油条网页正文提取器.Net组件1.0
该组件包括一个开发用的DLL,用.net编写,里面有一个asp.net的DEMO文件(这个是时隔去年DEMO发布后的1年才发布,但是和1年前版本是一样的,新版本暂不予发布)。
大家可以在非商业用途使用。
金油条正文提取器是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。
最新版本和在线演示。详见:
http://www.shoula.net/ParseContent
如果要最新版本,或者对这个感兴趣的。
可以和我联系或者加入
QQ群:50453294. QQ:6782435
金油条
2009-09-01
油条桌面知识检索系统企业版 0.9beta
具有从指定的监听目录里面搜索符合基本扩展名的文件,并且把搜索的文件的内容建立索引。从而可以全速的进行检索。帮助你管理本地硬盘上的知识。现在可以索引大部分文档。比如:word,excel,ppt,txt,pdf,html,以及各类文本文件。
具有文件内容察看器,可以不打开文件察看文件的内容。现在支持:word,excel,ppt,txt,pdf,html等文件。
文件抽取和百度桌面兼容,如果你要支持更多的文件类型,你可以到百度桌面搜索下载插件安装, 地址如下:
http://disk.baidu.com/plug-ins/main/list.php
服务器版能够为企业建立快捷方便的知识管理。
2008-12-30
金油条网页正文提取器
该DEMO文件是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。
最新版本和在线演示。详见:
http://www.shoula.net/ParseContent
如果要最新版本,或者对这个感兴趣的。
可以和我联系或者加入
QQ群:50453294. QQ:6782435
金油条
2008-08-03
金油条网页正文提取器1.0
该DEMO文件是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。
最新版本和在线演示。详见:
http://www.shoula.net/ParseContent
如果要最新版本,或者对这个感兴趣的。
可以和我联系或者加入
QQ群:50453294. QQ:6782435
金油条
2008-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅