这次的主题是,把CSV(或其他)文件格式的数据,存储进MySQL数据库,并且表结构主键都要建立。包括日期格式的处理。虽然很简答,但是有很多细节的东西,而且知识面也比较广,就写下来。
三张表格,如下
articles:
issues:
sales:
import numpy as np
import pandas as pd
# 和数据库交互的模块,这里和pandas共同作用,如果没有就自己pip。
import sqlalchemy
# 这是表,元数据,外键等,一会可能会用到。
from sqlalchemy import Table,MetaData,ForeignKey,Column,Integer,String,DateTime,Date,Float
# 先读取数据集,看看数据的格式空值等等,要不要加以处理,不能一股脑随便的就进数据库
# 第一个数据里面不整齐,有多余的分隔符,所以就取了前4列
data1 = pd.read_csv("../data/hfda_ch12_articles.csv",sep=",",usecols=[0,1,2,3])
data2