Nutch学习心得

用Nutch成功搭建了站内搜索的环境。遇到很多问题是很多很多的,但是办法总比困难多

这里杂乱的说说。

比如Nutch给出的demo中,很多配置文件都是直接写在conf,也就是编译的根目录底下。当我用svn提交自己项目以后,别人check out下来,根本就用不了。

还有自己看了看Nutch0.9高亮处理,与0.8也许多不同。

0.8高亮显示比较简单,网上也有很多介绍代码。修改如下:

将org.apache.nutch.searcher.Summary 第 54行 代码 修改为:

 public String toString() { return "<span style='color:red'>" + super.toString() + "</span>"; }

0.9中,

 

public String toHtml(boolean encode) {
    Fragment fragment = null;
    StringBuffer buf = new StringBuffer();
    for (int i=0; i<fragments.size(); i++) {
      fragment = (Fragment) fragments.get(i);
      if (fragment.isHighlight()) {
        buf.append("<span class=\"highlight\">")
           .append(encode ? Entities.encode(fragment.getText())
                          : fragment.getText())
           .append("</span>");
      } else if (fragment.isEllipsis()) {
        buf.append("<span class=\"ellipsis\"> ... </span>");
      } else {
        buf.append(encode ? Entities.encode(fragment.getText())
                          : fragment.getText());
      }
    }
    return buf.toString();
  }
 

 

通过搜索获取到的summary的字符串是: <span class="highlight">***</span>

然后通过定义highlight的样式来处理高亮。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值