logstash关于mysql和ES的同步问题

在config里复制logstash-sample.conf,写一个自己的conf

在这里插入图片描述
mytask.conf的配置如下

# Sample Logstash configuration for receiving
# UDP syslog messages over port 514

input {
  jdbc {
    jdbc_driver_library => "D:\ElasticSearch\logstash-7.17.11\config\mysql-connector-java-8.0.29.jar"
    jdbc_driver_class => "com.mysql.jdbc.Driver"
    jdbc_connection_string => "jdbc:mysql://localhost:3306/ysou"
    jdbc_user => "root"
	jdbc_password => "root"
	use_column_value => true
    tracking_column_type => "timestamp"  
    tracking_column => "updatetime"
    parameters => { "favorite_artist" => "Beethoven" }
    schedule => "*/5 * * * * *"
    statement => "SELECT * from post where updateTime > :sql_last_value and updateTime < now() order by updateTime desc"
    jdbc_default_timezone => "Asia/Shanghai"
  }
}

output {
  stdout { codec => rubydebug }
  elasticsearch {
	hosts => "127.0.0.1:9200"
	index => "post_v1"
	document_id => "%{id}"
   }
}

use_column_value设为true, tracking_column_type就是会动态改变查询条件的:sql_last_value的值, tracking_column就是代表会取哪个字段的最后一条作为sql_last_value的值写进去

注意:查询语句中要按tracking_column的字段进行排序,保证最后一条是最大的

注意:被记录的值是根据logstash能读取到的值进行保存的,tracking_column记录的值是存在D:\ElasticSearch\logstash-7.17.11\data\plugins\inputs\jdbc里的logstash_jdbc_last_run里。如果要全量更新,只需要删除D:\ElasticSearch\logstash-7.17.11\data\plugins\inputs\jdbc里的logstash_jdbc_last_run文件(这个文件存储了上次同步到的数据)
在这里插入图片描述

踩坑:在logstash里, logstash会把读取的内容字段改成小写,所以配置里的tracking_column_typetracking_column的updateTime和Timestamp都改成updatetime和timestamp,这样才能把读取文件的最新的updatetime的值写进sql_last_value
在这里插入图片描述

在logstash的bin目录中输入cmd打开编辑窗口

输入 logstash.bat -f ..\config\mytask.conf

这时,logstash就会把数据库的数据同步到elasticsearch中,但同时会出现两个问题:

1.字段全变成小写了
2.多了一些我们不想同步的数据

这时就要用到logstash的数据处理功能了 官网文档

所以配置文件要改成:

# Sample Logstash configuration for receiving
# UDP syslog messages over port 514

input {
  jdbc {
    jdbc_driver_library => "D:\ElasticSearch\logstash-7.17.11\config\mysql-connector-java-8.0.29.jar"
    jdbc_driver_class => "com.mysql.jdbc.Driver"
    jdbc_connection_string => "jdbc:mysql://localhost:3306/ysou"
    jdbc_user => "root"
	jdbc_password => "root"
	use_column_value => true
    tracking_column_type => "timestamp"  
    tracking_column => "updatetime"
    parameters => { "favorite_artist" => "Beethoven" }
    schedule => "*/5 * * * * *"
    statement => "SELECT * from post where updateTime > :sql_last_value and updateTime < now() order by updateTime desc"
	jdbc_default_timezone => "Asia/Shanghai"
  }
}

filter {
    mutate {
        rename => {
			"updatetime" => "updateTime"
			"userid" => "userId"
			"createtime" => "createTime"
			"isdelete" => "isDelete"
		}
		remove_field => ["thumbnum","favournum"]
    }
}

output {
  stdout { codec => rubydebug }
  elasticsearch {
	hosts => "127.0.0.1:9200"
	index => "post_v1"
	document_id => "%{id}"
   }
}

然后启动logstash,可以看到elasticsearch是已经写入了数据且按照自己想要的字段进行展示

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值