导入数据用的一般是这个命令:
load data infile '路径' into table 表名 fields terminated by ',' optionally enclosed by '"' ignore 1 rows;
一般情况下我们需要新建立一个表(或者清除原来表里的数据:TRUNCATE TABLE 表名;)然后我这里是对需要用到的数据进行了处理,对所有数据的id进行了NAN处理,我这里用的是pandas和numpy,处理完之后保存。
import pandas as pd
import numpy as np
df = pd.DataFrame(pd.read_csv('路径'))
df['id'] = np.nan
df.to_csv('路径')
接下来是MySQL导入数据可能出现的问题解决;
MySQL不允许导入自增主键的值,与sql_mode参数有关;
经查询,sql_mode的值为
ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION
修改为"" 导入并distinct查询结果
使用set sql——mode="";再进行show variables like 'sql_mode';
sql_mode理论上只需要改一次,所以剩下的直接load data就可以
接下来就是导数据,按照上面的命令输入,显示query OK就表示可以。