深入解析Lucene技术
活动形式及地点:华章聊天室: http://u.china-pub.com/coolchat/
活动时间:2008年 10月15 日下午14:30~16:00
活动背景:
近年来,搜索引擎成为技术热点,在商业搜索引擎不开放代码的情况下,想了解引擎内部运行机制,只有通过开源项目。所以面对开源的项目我们不仅要使用它们,更应该了解它是怎么做出来的,这就需要对内核源代码进行分析。Lucene即是一个应用非常广泛的,具有全文检索功能的开源Apache核心项目,它是Web搜索引擎的基础,性能优异。想对搜索领域有所了解,对Lucene的分析不可缺少。 随着Lucene的进步,开发人员从应用到内核开始深入的了解,Lucene的文本分析,创建索引,查询过程都有着巧妙的编程方法与令人着迷的算法而值得大家研究,他们决定着引擎的实用效能。几乎很少有人对Lucene的查询过程进行分析(可能都认为是创建索引的逆过程),Lucene作者在提高查询性能上的思考过程值得追寻,“并发合并”,“分块处理”等等方法的背后还有很多的故事等待揭示。
目前,除了谷歌和百度外,各个大型门户网站都有其自己的搜索引擎,在这样的格局下, Lucene应该扮演怎样的角色?
华章IT聊天室与中国互动出版网携手邀请《lucene应用与分析》的两位作者一起做客华章聊天室与大家畅谈您所关心的Lucene方方面面技术。
专家的点滴之语,都会给我们顿悟与思索,而您的参与更是一种智慧的碰撞!您准备好了吗?
相关问题:
1) Lucene采用的索引结构有什么特性,为什么会具有这种特性?
2) 在查询前,查询引擎是否也像汽车的引擎一样预热一下?
3) Hadoop对Lucene有什么补充?
嘉宾介绍:
吴众欣:
西安交大电信学院新型机所博士在读,兴趣为搜索引擎与服务组合。喜欢研读,头脑虽慢,滴水石穿。好奇心重,兴趣广泛,知是缺点,在克服中。
沈家立:
2003年开始使用Java开发项目,主要从事电子商务和电子支付领域。喜欢研究开源项目,是bbs.wnetw.net的创建者之一,并担任BEA天津User Group Leader。
活动协办:
事先提问,获取大奖环节介绍
您可以把对Lucene技术的问题或观点提前发给我们,我们会从中选出有代表性的问题让嘉宾与主持人来共同探讨,对其中一些有价值的问题与观点,我们会采取奖励。请大家踊跃参与!
问题请发至:dzb@hzbook.com 或 sheguang@hzbook.com
问 题:____________
姓 名:_____________
联系电话:____________
EMAIL:______________
详细地址:_____________
邮 编:______________
擅长技术:_____________如:C#程序开发、PHP程序设计 等
奖品: (点击查看本书详细信息)
聊天室使用说明
1.聊天室地址:http://u.china-pub.com/coolchat/
2.聊天室注册采用实名制。在聊天室主页面里填入您的真实姓名、密码及字体颜色就可以进入聊天室中。以后进入聊天室就使用此姓名及密码。
3.如果遇到同名者,请在姓名后面加入数字等符号。
注意:
1.如果进入后输出字体是乱码,请按F5刷新解决此问题。
2.如果按F5仍然没有解决,请退出聊天室,重新选择一种字体颜色。
3. 如有任何问题,欢迎大家反馈意见至:dzb#hzbook.com(#=@)