canal.adapter同步 ES 索引创建 大概配置详情

canal.adapter同步 ES 索引创建 大概配置详情

PUT /test  
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 0,
    "analysis": {
      "analyzer": {
        "htmlStripAnalyzer": {
          "filter": ["lowercase", "classic", "trim"],
          "char_filter": ["html_strip"],
          "type": "custom",
          "tokenizer": "standard"
        },
        "chinese_analyzer": {
          "type": "custom",
          "tokenizer": "ik_max_word"  // 使用 IK 分词器进行中文分词
        }
      },
      "char_filter": {
        "html_strip": {
          "type": "html_strip"
        }
      },
      "tokenizer": {
        "ik_max_word": {
          "type": "ik_max_word"
        }
      }
    }
  },
  "mappings": {
    "dynamic": "true",
    "_source": {
      "excludes": [
        "fujcontent",
        "projdetail"
      ]
    },
    "date_detection": false,
    "numeric_detection": false,  
    "properties": {
      "results_id": { 
	      "type": "integer",
        "fields": {
          "raw": {
            "type": "keyword",
            "null_value": "NULL",
            "ignore_above": 256
          }
        }
	  },
      "notice_num": {
   	    "type": "text", 
        "fields": {
          "raw": {
            "type": "keyword",
            "null_value": "NULL",
            "ignore_above": 256
          }
        }	  
	  },
      "organ": { "type": "text", "analyzer": "htmlStripAnalyzer" },
      "owner": { "type": "text", "analyzer": "htmlStripAnalyzer" },
      "project": { "type": "text", "analyzer": "htmlStripAnalyzer","copy_to": "combined" }, // 关联关系 "copy_to": "combined"
      "combined": {     // 定义关键词(关联关系)   搜索 combined 字段,显示其他两项关联字段
        "type": "text"
      },
      "content": { "type": "text", "analyzer": "ik_max_word","copy_to": "combined" }, // 关联关系 "copy_to": "combined"
      "html": { "type": "text", "analyzer": "htmlStripAnalyzer" }, 
      "by1": { "type": "keyword" },
      "editip": { "type": "text", "analyzer": "chinese_analyzer" },  // 使用中文分析器
      "bid_time": { 
        "type": "date", 
        "format": "strict_date_optional_time",
        "null_value": "1970-01-01T00:00:00",
        "copy_to": "combined"
      },
      "jointime": { "type": "date", "format": "yyyy-MM-dd'T'HH:mm:ss" },
      
分析器配置:

htmlStripAnalyzer: 使用 html_strip 字符过滤器,lowercase, classic, 和 trim 过滤器。适用于处理 HTML 内容,清理标签并进行标准化处理。
chinese_analyzer: 使用 ik_max_word 分词器进行中文分词。适用于中文文本的详细分词处理。

字段配置:

project 和 content 字段都配置了 copy_to 为 combined,这意味着它们的内容会被复制到 combined 字段,以便	进行跨字段搜索。
combined 字段没有配置分析器或分词器,Elasticsearch 会默认使用 standard 分词器。如果你需要对 combined 	字段使用特定的分析器或分词器,可以在 combined 字段中进行设置。
editip 字段使用了 chinese_analyzer,适合处理中文文本。
bid_time 字段使用了 date 类型,并且配置了 copy_to 为 combined,这意味着时间信息也会被复制到 combined 字段。

结构 根据自己本机mysql结构配置
作者只是把结构需要的大概配置记录一下

在这里插入图片描述

### 回答1: canal.adapter-1.1.5.tar.gz是一个压缩文件,通常被用于分发和安装软件。根据文件名来推测,这个文件很可能与canal.adapter软件的版本1.1.5有关。canal.adapter是一个用于数据同步和实时数据抽取的开源工具,可以将数据库中的变更数据实时地推送到其他系统进行处理和分析。 .tar.gz是一种常见的压缩文件格式,.tar表示将多个文件或目录打包成一个.tar文件,.gz表示对.tar文件进行gzip压缩。所以canal.adapter-1.1.5.tar.gz文件首先需要进行解压缩,才能使用其中的内容。解压缩这个文件的方式可以使用命令行工具如tar或7-Zip等软件。 解压缩后,我们可以看到其中可能包含有源代码、库文件、配置文件等相关文件。这些文件可以根据需要进行调整和配置,以便正确地运行和使用canal.adapter工具。 使用canal.adapter-1.1.5.tar.gz文件,我们可以在项目中使用最新版本的canal.adapter来进行数据同步和实时数据抽取的开发。可以通过编译源代码、配置相关参数和引入依赖等步骤,将canal.adapter集成到我们的项目中,从而实现实时的数据库数据同步功能。 总之,canal.adapter-1.1.5.tar.gz是一个压缩文件,与canal.adapter软件及其版本1.1.5相关。它是一个用于数据同步和实时数据抽取的工具,通过解压缩并进行相关配置,我们可以在项目中使用这个工具实现数据库数据的实时同步。 ### 回答2: canal.adapter-1.1.5.tar.gz 是一个文件的压缩包。其中 canal.adapter 是一个数据传输工具,可以与 Canal 进行配合使用。Canal 是阿里巴巴的一个开源项目,用于实时同步 MySQL 或者 PostgreSQL 数据库的数据到消息队列或者其他存储中。 通过解压 canal.adapter-1.1.5.tar.gz 文件,我们可以获得 canal.adapter-1.1.5 文件夹,其中包含了 canal.adapter 的相关文件和配置。 在使用 canal.adapter 进行实时数据同步时,我们可以根据不同的业务需求进行配置。主要的配置文件包括 instance.propertiesadapter.properties。instance.properties 用于配置数据库的连接信息,如数据库的地址、端口、用户名和密码等。adapter.properties 则可以配置数据同步的规则,包括指定要同步数据库、表以及需要传输到的目标存储等。 下载并安装 canal.adapter-1.1.5 版本后,我们可以使用命令行或者配置启动脚本来启动 canal.adapter。启动后,canal.adapter 将会根据配置规则进行数据同步。当数据库中的数据发生变化时,canal.adapter 将会将变更的数据发送到指定的消息队列或者存储,以供其他应用程序使用或者分析。 可以说,canal.adapter-1.1.5.tar.gz 提供了一个方便可靠的数据传输工具,可以帮助开发者实现数据库数据的实时同步,方便数据的处理和利用。 ### 回答3: canal.adapter-1.1.5.tar.gz是一个压缩文件,通常用于存储和传输文件。根据后缀名.tar.gz,我们可以推断这是一个使用tar和gzip算法进行压缩的文件。 Canal.adapter-1.1.5.tar.gz的具体内容无法确定,因为它只是一个文件的名称。它可能是一个软件包、库文件或其他类型的文件。 Canal.adapter-1.1.5.tar.gz可能是Canal Adapter的一个版本,Canal Adapter是一种用于数据同步的工具。Canal Adapter提供了通过Canal获取MySQL数据库的更新事件,并将其转发到其他存储、消息队列或分析系统的能力。 .tar.gz是一种常见的压缩文件格式,在Linux和Unix系统中被广泛使用。通过解压tar.gz文件,我们可以得到原始的文件或文件夹。 要解压.tar.gz文件,可以在命令行中使用常见的解压工具,例如tar命令。我们可以使用以下命令进行解压: ``` tar -zxvf canal.adapter-1.1.5.tar.gz ``` 解压后,我们可以在适当的目录中找到相应的文件。进一步操作取决于该文件的用途和目的。 需要注意的是,300字的篇幅非常有限,上述回答只是对Canal.adapter-1.1.5.tar.gz进行的初步猜测,并不能提供关于该文件的详细信息。如需进一步了解,建议查看相关文档或咨询相关的技术人员。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值