![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
H-T-TYSK
time!
展开
-
数据挖掘csv文件与xls文件预处理
(1)、在windows下的csv文件,默认打开方式是GBK格式,在linux下打开的文件默认是utf-8的格式。所以windows下的格式在linux下会出现中文乱码的现象。使用iconv命令对整个文件进行转码的操作。sudo iconv -f GBK -t UTF-8 d_train_20180102.csv -o new_d_train.csv后面的第一个csv为需要转码操作的文原创 2018-01-10 16:10:01 · 1566 阅读 · 0 评论 -
数据挖掘csv文件与xls文件预处理
(1)、在windows下的csv文件,默认打开方式是GBK格式,在linux下打开的文件默认是utf-8的格式。所以windows下的格式在linux下会出现中文乱码的现象。使用iconv命令对整个文件进行转码的操作。sudo iconv -f GBK -t UTF-8 d_train_20180102.csv -o new_d_train.csv后面的第一个csv为需要转码操作的文...原创 2018-03-07 18:30:43 · 749 阅读 · 0 评论