logstash multiline处理csv单元格多行数据的double quotes问题（exception=＞#＜CSV::MalformedCSVError: Unclosed quoted）

Allen Wu(WU, ZHWIEI)

已于 2022-12-06 11:34:27 修改

阅读量602

点赞数

分类专栏： logstash 文章标签： logstash multiline MalformedCSV

于 2022-12-06 11:32:27 首次发布

本文链接：https://blog.csdn.net/qq_17011423/article/details/128199889

版权

logstash 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在csv文件里的格式

“field1”,“field2”,“field3”,"line1
line2
line3
",“field5”
可以看到上面field4里面有被换行成几行来显示了。
这是我们用logstash去读取：

input {
  file {
      path => [ "file.csv" ]
      start_position => "beginning"
      sincedb_path => "/dev/null"
  }
}


filter {
  csv {
      separator => ","
      skip_header => "true"
      columns => ["field1","field2","field3","field14,"field5"]
  }


}


output {
    stdout {}
    elasticsearch{
        hosts => ["https://ip:9200"]
        ssl => true
        cacert => "/etc/logstash/certs/rootCA.crt"
        api_key => "api_key "
        index => "alert-%{+YYYY-MM-dd}"
    }
}

这时候会遇到下面的错误信息

exception=>#<CSV::MalformedCSVError: Unclosed quoted field on line 1

解决办法：
在file代码块里面加入下面代码：

codec => multiline {
        pattern => "^\"XXX"
        negate => "true"
        what => "previous"
      }

^是从行的开头开始，
"XXX是匹配每一行开头的字符串
这样就可以解析了，我实测过，可以解析成功。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Allen Wu(WU, ZHWIEI)

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

nginx grok 正则错误的输出情况

zhaoyangjian724的专栏

08-29

2277

nginx 配置: http { include mime.types; default_type application/octet-stream; log_format main '$http_host $server_addr $remote_addr [$time_local] "$request" '

Spark 读取CSV 解析单元格多行数值问题

ice泉的博客

11-14

3573

CSV 样例数据[hadoop@ip-10-0-52-52 ~]$ cat test.csv id,name,address 1,zhang san,china shanghai 2,li si,"china beijing" 3,tom,china shanghaiSpark 2.2 以下版本读取 CSV 会存在读取异常问题 scala> val df1 = spark.read.optio

参与评论您还未登录，请先登录后发表或查看评论

OpenCsv报错：CsvMalformedLineException

最新发布

qq_45690493的博客

04-23

420

使用opencsv导入csv文件数据，出现该异常。

Logstash系列：多行匹配

NIO4444

01-11

513

Exception in thread "main" java.lang.NullPointerException at com.example.myproject.Book.getTitle(Book.java:16) at com.example.myproject.Author.getBookTitles(Author.java:25) at ...

CSV Import fails with sun.io.MalformedInputException

仰望者！

10-29

1296

http://confluence.atlassian.com/display/JIRAKB/CSV+Import+fails+with+sun.io.MalformedInputException SymptomsWhen trying to import issues via CSV the following error is thrown and the import f

去除文件头部的u+feff_关于FEFF的简短故事，一个不可见的UTF-8字符破坏了我们的CSV文件

cumi7754的博客

07-25

2270

去除文件头部的u+feffToday, we encountered an error while trying to create some database seeds from a CSV. This CSV was originally generated by me using a Ruby script which piped the output to a file and save...

logstash-input-jdbc 实现数据库同步es(全量和增量)

qq_33471278的博客

11-09

1079

最近在学es，在数据方面碰到第一个问题是怎么将postgres中的数据库中同步到es中，在网上找了下相关文档，只有logstash-input-jdbc这个插件还在维护，而且在es中logstash高版本已经集成了这一插件，所以就省去了安装ruby和安装插件这一步了 1 安装elasticsearch logstash kibana 三件套 2 下载数据库驱动图方便的话可以直接拷贝maven仓库里面的即可 3 添加 .conf文件 input { jdbc { # my

date时区 es logstash_logstash7.2报错inputs.jdbc query 时区偏移导致的错误。

weixin_30453651的博客

01-17

594

环境:winserver2016，elk7.2，sqlserver2017,采集sqlserver 30多个表的全部记录，用于全文检索，所以一个索引下有几十个列名不同的日期字段datetime类型最终存在es的记录上所有datetime，时间都减了8个小时，在kibana里查询2017-03-15，会出现2017-3-16的记录，在logstash导入遇到到特定几个夏令时时间时还会报错错误信息：l...

windows环境logstash提示Successfully started Logstash API endpoint {:port=＞9600}

喜羊羊love红太狼

06-29

2798

场景：启动logstash文件，有时写入ES数据（创建索引并添加数据），有时失败提示如下 C:\Users\admin\Desktop\work\logstash\logstash-5.1.1\bin>logstash -f logstash.conf Could not find log4j2 configuration at path /Users/admin/Desktop/work/logstash/logstash-5.1.1/config/log4j2.properties. Us..

ELK安装过程中常见的问题

king_weng的博客

06-02

1932

一、elasticsearch 1、OpenJDK 64-Bit Server VM warning: Option UseConcMarkSweepGC was deprecated in version 9.0 and will likely be removed in a future release. 解决：关闭虚拟机并将处理器的的“每个处理器的内核数量”改为2。 2、main ERROR Could not register mbeans java.security.Acc.

ELK(-head)操作csv(txt)

ITMAN009的博客

09-09

699

elasticsearch-head 操作 elasticsearch 7.8 1、Filebeat（采集数据）+Elasticsearch（建立索引）+Kibana（展示） 2、Filebeat（采集数据）+Logstash（过滤）+Elasticsearch（建立索引）+Kibana（展示） ##################我们采用这种 3、Filebeat（采集数据）+Kafka/Redis/File/Console（数据传输）+应用程序（处理，存储，展示） 4、Filebeat（采

logstash日志换行处理小解

虚月的专栏

08-10

1892

logstash换行处理\\n 替换成\n

非常感谢！解答一下！

leotd65803056的专栏

03-11

416

import java.awt.*;//import java.net.*; import java.sql.*;import java.awt.event.*; class DataWindows extends Frame implements ActionListener { TextField tex

CSV解析报错

m0_45117743的博客

11-19

2159

报错信息： java.lang.RuntimeException: com.opencsv.exceptions.CsvRequiredFieldEmptyException: Number of data fields does not match number of headers. at com.opencsv.bean.concurrent.ProcessCsvLine.run(ProcessCsvLine.java:85) at java.util.concurrent.Thre...

opencsv 遇到的坑 Caused by: com.opencsv.exceptions.CsvRequiredFieldEmptyException: Number of data fields

qq_38308222的博客

06-14

6046

Caused by: com.opencsv.exceptions.CsvRequiredFieldEmptyException: Number of data fields does not match number of headers. 因为公司的系统是比较老的ERP，所以数据传输都通过ftp的方式及csv文件格式来传输。坑爹的是，ERP输出的列数不规范，导致一些行列少了...

php csv 特殊字符,c# - 如何解决：使用TextFieldParser读取csv文件时出现特殊字符 - 堆栈内存溢出...

weixin_35866960的博客

03-18

496

我正在导入一个csv文件，在读取该文件时，在读取的字符串中会出现特殊字符，如`` ''，以及如何避免这些unicode字符。我正在使用TextFieldParser解析数据，但是在读取时，句子中两个字符串之间的空格被替换为字符``。试图进行包含字符串搜索并替换字符，但是特殊字符以后可能会有所不同。Encoding DefaultEncoding = Encoding.UTF8;public I...

启动项目编译报错：Malformed argument has embedded quote

黄黄黄黄黄的博客

11-17

2818

可能导致的问题： 1.安装插件导致 2.配置运行参数导致但解决方式一样，Run --> Edit Configurations --> Spring Boot --> ***Application -->VM options中添加：-Djdk.lang.Process.allowAmbiguousCommands=true

CSVReader读取数据缺失

LKYXQTH的博客

08-16

7793

最近在项目中遇到一个导入CSV文件的程序数据缺失严重.2.4G的报表600多万行,导入数据库实际只有200多行,最后终于找到了问题的所在,并解决了.记录Mark一下

大量csv数据的查询和计算的技术实现路径分析(1)

cafebar123的专栏

04-14

2152

在工作中，会有处理很多数据的场景。比如，用户需求：我有大量数据，（1）我想要高效查询我想要的数据。（2）我想要高效计算出我想要的结果数据。为了存储数据，我们使用的数据存储方式有： mysql，oracle，表； csv文件 excel文件 hdfs文件系统 hbase redis，ehcache 把数据从存储区拿出来作分析，我们使用的数据分析手段有： jav...

[2023-07-06T22:21:46,159][INFO ][logstash.outputs.elasticsearch][main] Failed to perform request {:message=>&quot;PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target&quot;, :exception=>Manticore::ClientProtocolException, :cause=>#<Java::JavaxNetSsl::SSLHandshakeException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target>} 如何解决

07-07

这个错误提示表明 Logstash 在尝试与 Elasticsearch 建立连接时遇到了证书验证失败的问题。为了解决这个问题，你可以执行以下步骤： 1. 获取 Elasticsearch 服务器的证书：从 Elasticsearch 服务器获取证书文件（....