不同数据类型的清洗

第一步:定义文本格式类型  一般为 .txt   .cvs两种


第一种:

excel格式数据以逗号为分隔符.

用excel打开----->另存为---->选择csv文本格式 (如图)----->用记事本打开csv文件---->另存为--->选择utf-8编码--->确定



第二步:定义数据编码类型一般为 utf-8




第三步:处理数据存在形式(根据要求操作当分行保存时操作此步)


第二种 以Tab键为分隔符:

用excel打开----->另存为---->选择txt文本格式----->用记事本打开txt文件---->另存为--->选择utf-8编码--->确定 如上图



将两种格式文件导入到Linux中,右双击---->display----->search---->replace  进入下第二个界面图


如图:


根据相应文件分隔符对数据分行处理 若是tab键或者逗号为分隔符 

  下图 第一行输入\t 或者逗号         第二行  \n




第四步 导入集群中




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值