python读写不同数据源的数据
1.数据库数据读取
#python连接数据库
##方法一
import pandas as pd
from sqlalchemy import create_engine
engin = create_engine('mysql+pymysql://root:123456@127.0.0.1:3306/test?charset=utf8')@[TOC](这里写自定义目录标题)
engin
pd.read_sql_table('meal_order_detail1', con=engin)
pd.read_sql_query('select * from meal_order_detail1', con=engin)
pd.read_sql('meal_order_detail1', con=engin)
pd.read_sql('select * from meal_order_detail1', con=engin)
DataFrame.to_sql(name, con, schema=None, if_exists=’fail’, index=True, index_label=None, dtype=None)
##方法二
import pymysql
conn = pymysql.connect(
host = '127.0.0.1', #ip
port = 3306, #端口
user = 'root', #用户名
passwd = '123456', #密码
db = 'test', #数据库名
chartset = 'utf8'
)
#.............to do..............
conn.commit() #用来提交事务
2.文本文件的读写
#使用read_table来读取文本文件。
pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
#使用read_csv函数来读取csv文件。
pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
read_table和read_csv函数中的sep参数是指定文本的分隔符的,如果分隔符指定错误,在读取数据的时候,每一行数据将连成一片。
header参数是用来指定列名的,如果是None则会添加一个默认的列名。
encoding代表文件的编码格式,常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等。如果编码指定错误数据将无法读取,IPython解释器会报解析错误。
文本文件的存储和读取类似,结构化数据可以通过pandas中的to_csv函数实现以csv文件格式存储文件。
DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None, header=True, index=True,index_label=None,mode=’w’,encoding=None)
3.Excel文件读取
pandas提供了read_excel函数来读取“xls”“xlsx”两种Excel文件。
pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
将文件存储为Excel文件,可以使用to_excel方法。其语法格式如下。
DataFrame.to_excel(excel_writer=None, sheetname=None’, na_rep=”, header=True, index=True, index_label=None, mode=’w’, encoding=None)
to_csv方法的常用参数基本一致,区别之处在于指定存储文件的文件路径参数名称为excel_writer,并且没有sep参数,增加了一个sheetnames参数用来指定存储的Excel sheet的名称,默认为sheet1。