迅龙的数据库反向还原算法结构

最新推荐文章于 2024-07-14 22:01:18 发布

lixiaobai

最新推荐文章于 2024-07-14 22:01:18 发布

阅读量1.2k

点赞数

分类专栏：编程算法开源搜索引擎文章标签：算法数据库 url web

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_net/article/details/1520480

版权

编程算法同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

开源搜索引擎

18 篇文章 0 订阅

订阅专栏

迅龙的数据库反向还原算法结构

迅龙的信息抽取算法通过小规模采样的机器学习方法来处理半结构化的Web数据
主要有5个部分
1 采样：得到可能有来源于一个动态页面程序的一个URL队列
2 自动分析：得到采样队列对应的数据队列得到一个原始模板
3 自动标注：根据采样结果和原始模板标注得到一个滤波模板
4 手工标注：手工修正自动生成的结果
5 自适应过滤：对于不同的页面数据自动适应不同的过滤模板最坏的情况是使用内置的默认信息抽取

迅龙中文搜索 0.7 nSearch版

源代码 2007.2.27日发布

下载 http://gforge.osdn.net.cn/projects/xunlong/

以发展中国的开源软件事业为己任

促进中文搜索技术的交流与合作！

宁夏大学张冬http://zd4004.blog.163.com/

2007.3.4

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
迅龙的数据库反向还原算法结构

迅龙的数据库反向还原算法结构迅龙的信息抽取算法通过小规模采样的机器学习方法来处理半结构化的Web数据主要有5个部分1 采样：得到可能有来源于一个动态页面程序的一个URL队列2 自动分析：得到采样队列对应的数据队列得到一个原始模板3 自动标注：根据采样结果和原始模板标注得到一个滤波模板4 手工标注：手工修正自动生成的结果5 自适应过滤：对于不同的页面数据自动适应不同的过
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。