在使用Python处理数据之前,我们将要分析的数据导入Python中,下面介绍几种常用的导入方式:
一、CSV类型
import pandas as pd
a=pd.read_csv('文件名')
#查看导入详情
a.info()
a.describe()
举例
train = pd.read_csv('train.csv',dtype={"Age": np.float64}) #载入训练集,Age的类型是float64位
test = pd.read_csv('test.csv',dtype={"Age": np.float64}) #载入测试集,Age的类型是float64位
二、Excel类型
import pandas as pd
a=pd.read_excel('文件名')
三、MySql数据库连接
import pymysql
import pandas as pd
#连接数据库
conn=pymysql.connect(
host='数据库地址',
user='用户名',password='密码',
db='数据库名',
charset='utf8'
)
#从数据库中读取数据
sql = "select * from AgencyAccount"
df = pd.read_sql(sql,conn)
conn.close()
#进行一些其他操作,此时数据已经是DataFrame格式了,最后关闭数据库连接