数据接口
1.csv文件的读取和写入
# 1-读取csv文件
# 第一种方法(默认分隔符为逗号)
df = pd.read_csv('./data/BankData.csv')
print(df)
输出结果:(部分)
分行编号 不良贷款(亿元) 各项贷款余额 本年累计应收贷款(亿元) 贷款项目个数 本年固定资产投资额(亿元)
0 1 0.9 67.3 6.8 5 51.9
1 2 1.1 111.3 19.8 16 90.9
2 3 4.8 173.0 7.7 17 73.7
3 4 3.2 80.8 7.2 10 14.5
4 5 7.8 199.7 16.5 19 63.2
# 2-让“分行编号”作为索引列
df = pd.read_csv('./data/BankData.csv', index_col='分行编号')
print(df)
输出结果:(部分)
分行编号 不良贷款(亿元) 各项贷款余额 本年累计应收贷款(亿元) 贷款项目个数 本年固定资产投资额(亿元)
1 0.9 67.3 6.8 5 51.9
2 1.1 111.3 19.8 16 90.9
3 4.8 173.0 7.7 17 73.7
4 3.2 80.8 7.2 10 14.5
# 3-获取文件中数据的行数
r = len(df)
print(r)
# 4-读取前面的几行(nrows=x,就读取前x行)
df = pd.read_csv('./data/BankData.csv', index_col='分行编号', nrows=3)
print(df)
# 5-读取csv文件的第二种方法
df = pd.read_table('./data/BankData.csv', sep=',') # .csv文件中的分隔符是','如果是tab空格分隔就用sep='\t'
print(df)
# 6-如果读取的.csv文件没有列名,如果直接读取,python会将第一行的数据当作列名
# 添加 header = None后,将不会出现这个现象
df = pd.read_csv('./data/BankData_1.csv', header=None)
print(df)
# 7-自定义列名
colname = ['分行编号', '不良贷款(亿元)', '各项贷款余额', '本年累计应收贷款(亿元)', '贷款项目个数', '年固定资产投资额(亿元)']
df = pd.read_csv('./data/BankData_1.csv', header=None, names=colname)
print(df.head())
# 8-导出到csv文件(指定编码方式,防止出现乱码)
df.to_csv('./data/1.csv', encoding='gbk')
2.Excel文件的读取和写入
import pandas as pd
# 1-读取excel文件的第一种方法
r = pd.read_excel('../data/BankData.xlsx', index_col='分行编号')
print(r)
# 2-读取excel文件的第二种方法 (先在cmd中安装pip install openpyxl)
import openpyxl
xls_file = pd.ExcelFile('../data/BankData.xlsx')
xls_data = xls_file.parse('bankdata', index_col='分行编号')
print(xls_data)
# 3-导出到Excel文件 (先在cmd窗口中安装pip install xlwt)
xls_data.to_excel('../data/2.xlsx')