一、数据导入
(一)读取CSV文件
1、读取本地CSV
#先创建一个CSV文件,存入数据,数据之间以“逗号”分割。 数据源来源于网络。
import pandas as pd
df = pd.read_csv("D:\\pycharm\\data\\data.csv")
print(df)
引用pandas需要先安装pandas包。输出结果:
2、读取网络数据CSV
import pandas as pd
data_url = "https://...csv" #网络读取
df = pd.read_csv(data_url)
(二)读取EXCEL文件#读取excel之前先打开命令行,安装xlrd。即在命令行中输入pip install xlrd。
import pandas as pd
df = pd.read_excel("D:\\pycharm\\data\\test.xlsx")
print(df)
输出结果:
(三)读取MySQL数据
#安装MySQLdb包,假设读取用户名username,密码password,读取mydb数据库中的数据
import pandas as pd #读取mysql
import MySQLdb
mysql_cn= MySQLdb.connect(host='localhost', port=3306,user='username', passwd='password', db='mydb')
df = pd.read_sql('select * from test;', con=mysql_cn)
mysql_cn.close()
二、数据导出
(一)导出到CSV文件
import pandas as pd
df = pd.read_excel("D:\\pycharm\\data\\test.xlsx")
print(df)
df.to_csv("D:\\pycharm\\data\\testcsv.csv", encoding='utf-8', index=False)#数据导出到tsetcsv.csv#
将test.xlsx的数据导入到testcsv.csv文件中#数据中含有中文,使用‘utf-8’,index=false去掉行名称导出
(二)导出到EXCEL文件
#先安装openpyxl包
import pandas as pd
import openpyxl
df = pd.read_excel("D:\\pycharm\\data\\test.xlsx")
df.to_excel("D:\\pycharm\\data\\excel2excel.xlsx", encoding='utf-8', index=False)#数据导出到excel2excel.xlxs#
dt = pd.read_excel("D:\\pycharm\\data\\excel2excel.xlsx")
print(dt)