Solr /export 海量数据导出实现

最新推荐文章于 2024-06-25 16:14:24 发布

iteye_10738

最新推荐文章于 2024-06-25 16:14:24 发布

阅读量2.5k

点赞数

文章标签：数据库 java 大数据

本文链接：https://blog.csdn.net/iteye_10738/article/details/82676483

版权

Solr需要流式导出海量数据，导出数据是基于流式的，当服务端match到第一条数据之后就会向客户端flush出数据。

需要导出的列需要将schema中field元素的docvalue设置为true，并且在solrconfig.xml中配置

<requestHandler name="/export" class="solr.SearchHandler">
 <lst name="invariants">
   <str name="rq">{!xport}</str>
   <str name="wt">xsort</str>
   <str name="distrib">false</str>
 </lst>
 <arr name="components">
   <str>query</str>
 </arr>
</requestHandler>

客户端的查询代码如下：

                final String[] fl = StringUtils.split(fields, ",");
		SolrClient client = new HttpSolrClient(url);

		query.setDistrib(false);
		query.setFields(fields);
		query.setRows(9999999);

		final PrintWriter writer = new PrintWriter(new OutputStreamWriter(
				FileUtils.openOutputStream(outfile), Charset.forName("utf8")));

		for (String f : fl) {
			writer.print(f);
			writer.print(",");
		}

		final AtomicInteger count = new AtomicInteger(0);
		QueryResponse result = client.queryAndStreamResponse(query,
				new StreamingResponseCallback() {
					@Override
		public void streamSolrDocument(SolrDocument doc) {
						// process doc
					}

		public void streamDocListInfo(long numFound, long start,
							Float maxScore) {
						// writer.println("numFound:" + numFound);
					}
				});
		writer.close();
		System.out.println("numFound:" + result.getResults().getNumFound());
		client.close();

solr服务端相关的代码：

QP：

ExportQParserPlugin 在export handler中使用QP

查询结果流式排序输出：

SortingResponseWriter

iteye_10738

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Solr /export 海量数据导出实现

Solr需要流式导出海量数据，导出数据是基于流式的，当服务端match到第一条数据之后就会向客户端flush出数据。需要导出的列需要将schema中field元素的docvalue设置为true，并且在solrconfig.xml中配置&lt;requestHandler name="/export" class="solr.SearchHandler"&gt; &l...
复制链接

扫一扫