![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
翻译
文章平均质量分 79
scottxp
某废柴
展开
-
A Survey of Web Information Extraction Systems——web信息抽取系统研究现状(一)
这一篇是信息抽取领域2006年比较权威的综述。其实本来翻译了2002年的一篇综述,那个字数比较少,不过一时蛋疼,把这个也搞了算了。本人中文英文都很烂,这个基本上是google自动翻译的水准,为了造福与我双语一样烂的后人放在这里。有离谱的地方请“自主规制”。原文全文共18页,大概80000印刷符号,今天半夜翻译了2500汉字。错误的地方请指出,转载请注明出处,谢谢。翻译 2009-05-30 04:47:00 · 2458 阅读 · 0 评论 -
A Brief Survey of Web Data Extraction Tools Web数据抽取工具综述
这是02年的一篇综述,可能是信息抽取领域被引用最多的文章之一。翻译量1W汉字,内容基本是直译的,应该比Google翻译的略强一点吧。这篇文章的恶心之处在于其PDF转换为文本是乱码,所以你也别想用Google翻译了。发在这里,希望对将要做相关毕设的懒鬼们有所帮助。转载请注明出处。A Brief Survey of Web Data Extraction Tools We翻译 2009-08-26 20:34:00 · 3090 阅读 · 0 评论 -
A Brief Survey of Web Data Extraction Tools Web数据抽取工具综述 (续)
6.参考文献[1] ABASCAL, R., AND SANCHEZ, J. A. X-tract: Structure extraction from botanical textual descriptions. In Proceeding of the String Processing & Information Retrieval Symposium and Internationa翻译 2009-08-28 21:41:00 · 2012 阅读 · 0 评论 -
Mining Data Records in Web Pages ——挖掘网页中的数据记录
这篇论文的引用频度比较高,应该说是基于DOM的全自动抽取算法中比较经典的。MDR算法的程序在作者的官网提供下载。限于篇幅,所有图表请参照原文。 作者后来又发表了一篇论文,Web Data Extraction Based on Partial Tree Alignment ,将MDR中的字符串编辑距离算法替换为树的简单匹配算法,新系统命名为DEPTA。 Mining Data翻译 2009-09-27 09:59:00 · 3093 阅读 · 1 评论