![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
信息抽取
文章平均质量分 80
topwong
这个作者很懒,什么都没留下…
展开
-
有关信息抽取的文章列表
SIGIR 2008[1] An Unsupervised Framework for Extracting and Normalizing Product Attributes from Multiple Web Sites[2] Enhancing Keyword-Based Botanical Information Retrieval with Information Extr转载 2010-01-05 13:56:00 · 882 阅读 · 0 评论 -
对本系统后续工作者的一点建议
对后续工作者的一点建议 build 0910111. 熟悉HtmlParser Java用于解析网页的开源库主要有HtmlParser和NekoHtml,模拟浏览器自动测试的有HtmlUnit,真正解析js或提取dom节点的视觉信息还是靠Mozilla的浏览器。 NekoHtml的效率和发展状况更好,但是实践表明HtmlParser是可以满足信息抽取任务的。HtmlParser结构比较好转载 2010-01-05 13:58:00 · 737 阅读 · 0 评论 -
搜索引擎检索技术
搜索引擎检索技术原创 2010-07-01 00:34:00 · 774 阅读 · 0 评论