写在前面
数据分析的学习进程已经进入到数据挖掘的学习阶段,回过头来发现,sql的一些知识还掌握得不是很透彻,仅仅是刷了50个sql面试题是完全不够的,实际工作中用的数据量非常大,要操作的表也非常多。为了增加实战经验,我从阿里云天池上下载了淘宝的用户数据,本文就从如何导入文件开始吧。
一、新建一个sckema
然后点击,注意这里charset需要改成utf-8
二、创建表
设置列名在这个下拉框中
这里我遇到报错了!
提示错误原因是engine引擎未修复,这里将引擎改为mySIAM就可以了
三、导入文件
右键点击建的表,点击table data import,
emmm…… 这个方法失败了,文件编码不对,怎么都导不进去
四、现在换命令行的方式
折腾一晚上,这个方法终于导入成功了,下面来介绍。
1、建立表
我这里要导入的是网上下载的orderinfo和userinfo,为了我后面作分析用,
建表的操作这里不赘述了,可以在命令行中建立,也可以在workbench中,这里注意编码选择utf8,因为文件编码是这个。
2、打开命令行
选择要用的数据库
然后查看文件的地址,这个是安全文件,需要从这个文件中带入文件才行(我也是网上找了好多处理办法,才找到这个),然后将要导入的文件放入这个文件夹中。
这里还有一补需要注意,需要修改local_infile状态
之后就可以执行以下命令了
然后显示成功。
我在导入order文件的时候,还出现了一个报错
说第一行太长? 然后我取看了下表的数据结构,PAIDTIME这个字段的字符串大小为10,我修改为255后就成功了。
以上就是我导入csv文件时遇到的坑,希望有帮助。