为自己的数据建立索引
创建数据集
./bin/solr create -c localDocs -s 2 -rf 2
为本地文件建立索引
支持JSON, XML and CSV ,使用 Post Tool 能处理HTML, PDF, Microsoft Office formats (such as MS Word)等等类型的文件。
./bin/post -c localDocs ~/Documents
执行post命令创建索引的过程可能不会那么顺利,因为你的数据可能是各种各样的,Solr会猜数据类型等,猜错了,建索引就会失败,可以参考前一篇文章建立schema。
DataImportHandler
这个工具,可以用来连接数据库、邮件服务器和其他结构化的数据资源。
在目录example/example-DIH下,有关于如何使用的例子等信息。
下面这个链接是官网的详细介绍:
Uploading Structured Data Store Data with the Data Import Handler
SolrJ
使用SolrJ进行编程式的数据导入建索引,具体的参见SolrJ的API文档。
这样可以定制化哪些数据需要发送到solr中。
Admin UI
使用Admin UI Documents tab
Updating Data
默认的schema中配置的数据主键是id。主键用于确定数据的唯一性,如果你多次用同一份数据建索引,数据的总数不会变,只会更新掉不同的数据内容。
文件在solr-7.6.0\server\solr\configsets\_default\conf\managed-schema中:
关于增量全量建索引的命令:
Deleting Data
通过id删除:
bin/post -c localDocs -d "<delete><id>SP2514N</id></delete>"
通过查询结果删除:
bin/post -c localDocs -d "<delete><query>*:*</query></delete>"
Spatial Queries
收尾:
停掉所有节点,删除节点
bin/solr stop -all ; rm -Rf example/cloud/
总结:
1、介绍了几种根据已有数据建立索引的方式,这个是需要实战的,后面继续来实战。
2、提到了全量更新,增量更新
3、空间查询