经常会碰到csv等相关的文件,其中有中文字符,很自然,我们会想到readcsv,readdlm等内置的函数。
但这些并不能处理,会报相关字符错误。
今天,主要来探讨一下,有关这方面的问题。
这里有一个csv文件,id.csv.格式如下:
一、加载相关库
using DelimitedFiles
using StringEncodings ## 关键库,特别重要!!!
using CSV
using DataFrames
二、生成dataframe格式
using CSV
using StringEncodings;
function read_csv(path)
data= CSV.File(open(read, path, enc"GB18030")) |> DataFrame
return data
end
这样的data就是我们所需要的类似readcsv的格式。
二、生成Array格式
using DelimitedFiles
data = open(readdlm, path, enc"GB18030")
但这个本质上是和这个是相同的:
这个读出是按每行,并没有形成Array{Any,2}.
还是回到CSV库吧
julia> data= CSV.File(open(read, path, enc"GB18030")) |> Array
注意,数据结构不是data[1,2],而是data[1][2]