solr与hadoop结合

4 篇文章 0 订阅
1 篇文章 0 订阅

solr4.4支持索引存储到hdfs中下载

hadoop2.1.0-beta下载

解压solr4.4,hadoop2.1.0-beta

我的solr是运行在tomcat web容器中

solr4.4用的是hadoop2.0.5alpha版本,如果不改成hadoop2.1.0-beta会报很多奇怪的错误。

删除solr webapp/WEB-INF/lib中的jar包,用我已经整合好的lib替换

整合好的tomcat下载

注意修改的地方

solrconfig.xml


?
1
2
3
4
5
6
7
8
9
10
11
12
< directoryFactory name = "DirectoryFactory" class = "solr.HdfsDirectoryFactory" >
   < str name = "solr.hdfs.home" >hdfs://192.168.1.100:9000/solr</ str >
   < bool name = "solr.hdfs.blockcache.enabled" >true</ bool >
   < int name = "solr.hdfs.blockcache.slab.count" >1</ int >
   < bool name = "solr.hdfs.blockcache.direct.memory.allocation" >true</ bool >
   < int name = "solr.hdfs.blockcache.blocksperbank" >16384</ int >
   < bool name = "solr.hdfs.blockcache.read.enabled" >true</ bool >
   < bool name = "solr.hdfs.blockcache.write.enabled" >true</ bool >
   < bool name = "solr.hdfs.nrtcachingdirectory.enable" >true</ bool >
   < int name = "solr.hdfs.nrtcachingdirectory.maxmergesizemb" >16</ int >
   < int name = "solr.hdfs.nrtcachingdirectory.maxcachedmb" >192</ int >
</ directoryFactory >
?
1
< lockType >${solr.lock.type:hdfs}</ lockType >
我是在tomcat的catalina.sh指定solr.solr.home=$CATALINA_HOME/solr的


hadoop集群配置可以参考hadoop官方伪分布式

要修改yarn.resourcemanager.hostname,由于我RM,NM,SecondaryNameNode都是在一台机器,所以就直接指定这个为一台机器的主机名

启动hadoop后查看http://192.168.1.100:8088/cluster/nodes

如果所有节点都可以看到说明正常

这时启动solr会出现不能创建文件夹错误Problem creating directory:

所以把权限限制关闭掉并且支持webhdfs,修改hdfs-site.xml

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
< property >
         < name >dfs.webhdfs.enabled</ name >
         < value >true</ value >
         < description >
                 Enable WebHDFS (REST API) in Namenodes and Datanodes.
         </ description >
  </ property >
< property >
         < name >dfs.permissions.enabled</ name >
         < value >false</ value >
         < description >
If "true", enable permission checking in HDFS. If "false", permission checking i
s turned off, but all other behavior is unchanged. Switching from one parameter
value to the other does not change the mode, owner or group of files or director
ies.
         </ description >
</ property >

hadoop2的新特性是出现了yarn 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Solr是一个开源的搜索平台,而Hadoop则一个用于处理大数据的分布式计算框架。 Solr可以与Hadoop集成,以实现对大数据的实时搜索。在早期版本Solr(例如Solr 4.4)中,使用的是Hadoop 2.0.5alpha版本。然而,如果您不将其更改为Hadoop 2.1.0-beta版本,可能会遇到一些奇怪的错误。 要查看Hadoop启动后的状态,您可以访问http://192.168.1.100:8088/cluster/nodes。在该页面上,您可以看到有关Hadoop集群的节点信息。 如果您对SolrHadoop之间的集成感兴趣,您可以查看这个链接http://www.slideshare.net/OpenLogic/realtime-searching-of-big-data-with-solr-and-hadoop,其中有关于如何在SolrHadoop之间进行实时搜索大数据的相关信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [solrhadoop结合](https://blog.csdn.net/lhfredfly/article/details/41045623)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [SOLR HADOOP(转)](https://blog.csdn.net/jinsx/article/details/83910410)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值