Python——文件读取

        Python可以读取不同格式的文件,下面简单来介绍一下:

        1、使用read_excel或read_csv读取文件,若在路径前加r,使用“\”

import pandas as pd

# 在路径前加r,使用“\”
df = pd.read_excel(r'C:\Users\merit\Desktop\测试.xlsx')

# 导入.csv文件,以“,”为分隔符
data=pd.read_csv(r'C:\Users\merit\Desktop\测试.csv', sep=",")

# 导入.csv文件,以“ 空白”为分隔符
data=pd.read_csv(r'C:\Users\merit\Desktop\测试.csv', sep=" ")

        2、使用read_excel或read_csv读取文件,若在路径前面不加r,使用“/”

import pandas as pd

# 在路径前面不加r,使用“/”
df = pd.read_excel('C:/Users/merit/Desktop/测试.xlsx')

# .xlsx文件有多个Sheet,可以通过设定sheet_name参数来指定要导入的sheet文件。
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name="Sheet1")

# 除可以指定具体Sheet的名字,还可以传入Sheet的顺序,从0开始。
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name=0)

        3 、可使用read_table()导入csv文件

data=pd.read_table(r'C:\Users\merit\Desktop\测试.csv',sep=",")

        4、读取文件,同时指定索引列。

        行索引使用从0开始的默认索引列,可以通过设置index_col参数来设置。

# 行索引:每一行的索引
# index_col表示用.xlsx文件中的第几列做行索引,从0开始计数。
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name=0,index_col=0)

# 列索引:每一列的索引,列标签。
# 使用第一行作为列索引
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name=0,header=0)

# 使用第二行作为列索引
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name=0,header=1)

# 使用默认从0开始的数作为列索引,从第一列开始从0编号:0、1、2、3......
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",sheet_name=0,header=None)

        5、指定导入列
        有时候本地文件列太多,而我们又不需要那么多列,我们可以通过设定usecols参数来制定要导入的列。

# 导入第一列,,usecols当中[]填写数字为0,则只输入0列,填3只输入第3列内容。
df = pd.read_excel("C:/Users/merit/Desktop/测试.xlsx",usecols=[0])

         6、导入指定行

# 指定读取行数,只需要设置nrows参数即可。读取3行数据
data=pd.read_csv(r'C:\Users\merit\Desktop\测试.csv',sep=",",nrows=3)

         7、engine 指定

        当文件名存在中文或者路径包含中文时,使用Python读取可能会报错,这时需要设置engine参数来消除这个错误。
 

data=pd.read_csv(r'C:\Users\merit\ceshi.csv',engine="python",encoding="utf-8")

        8、数据库读取

        Python链接数据库,导入SQL文件。Python连接数据库方法。首先导入pymysql模块创建链接;
        user:用户名
        password:密码
        host:数据库地址/本机使用localhost
        db:数据库名
        charset:数据库编码,一般为UTF-8

# # Python调取数据库当中,数据表的语句。
# 参数sql是需要执行的SQL;参数col是第一步创建好的数据库连接,即eng
import pymysql
eng = pymysql.connect(host='XXXXX',
                     user='XXXXX',
                     password='XXXXX',
                     db='XXXXX',
                     charset='utf8')
sql="select * from df1_csv"

df = pd.read_sql(sql,eng)

        9、指定编码格式

        指定编码格式,Python用的最多的两种编码格式是UTF-8和gbk,默认编码格式是UTF-8。
        如果是CSV  UTF-8(逗号分隔)格式的文件,那么导入的时候需要加encoding参数,也可以不加encoding参数,默认UTF-8;另一种格式encoding="gbk"。

 

# 导入UTF-8格式CSV文件
data=pd.read_csv(r'C:\Users\merit\Desktop\测试.csv',encoding="utf-8")

# 导入gbk格式CSV文件
data=pd.read_csv(r'C:\Users\merit\Desktop\测试.csv',encoding="gbk")

        以上就是比较常见的Python数据读取方式,还有哪些缺失可以留言告诉我哦!

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值