【Python】读取各种文档(txt、csv、excel、pdf)方法

1.读取txt文件

注意事项:

1..txt文件同下方脚本所在的.py文件需要在同一个文件夹下

1 # coding=utf-8
2 
3 txt读取
4 with open("1233.txt") as file:
5     for line in file:
6         print(line)

 

2.读取csv文件

注意事项:

1).csv文件同下方脚本所在的.py文件需要在同一个文件夹下

2).csv文件由来必须是,创建完excel文件后另存为csv文件,如果只是修改后缀名读取是不能成功读到csv文件中的内容的。

1 # coding=utf-8
2 import csv
3 
4 csv_file = open('csvfile_input.csv','r')
5 reader=csv.reader(csv_file)
6 for item in reader:
7     print(item)

3)读取+写入在一起时候的组合代码

 1 # 读取csv文件方式2
 2 csvFile = open("csvfile_input.csv", "r")
 3 reader = csv.reader(csvFile)  # 返回的是迭代类型
 4 data = []
 5 for item in reader:
 6     print(item)
 7     data.append(item)
 8 print(data)
 9 #csvFile.close()
10 
11 # 从列表写入csv文件
12 csvFile2 = open('csvFile3.csv', 'w', newline='')  # 设置newline,否则两行之间会空一行
13 writer = csv.writer(csvFile2)
14 m = len(data)
15 for i in range(m):
16     writer.writerow(data[i])
17 csvFile2.close()

 

 

 3.读取excel文件

文件内容(文件所在位置:E:\script\python-script\TestData.xlsx):

 

 

 1 # -*- coding: utf-8 -*-
 2 
 3 import xlrd
 4 
 5 from datetime import date,datetime
 6 
 7 def read_excel():
 8 
 9     ExcelFile=xlrd.open_workbook(r'E:\script\python-script\TestData.xlsx')
10 
11 #获取目标EXCEL文件sheet名
12 
13     print(ExcelFile.sheet_names())
14 
15 #------------------------------------
16 
17 #若有多个sheet,则需要指定读取目标sheet例如读取sheet2
18 
19 #sheet2_name=ExcelFile.sheet_names()[1]
20 
21 #------------------------------------
22 
23 #获取sheet内容【1.根据sheet索引2.根据sheet名称】
24 
25 #sheet=ExcelFile.sheet_by_index(1)
26 
27     sheet=ExcelFile.sheet_by_name('TestCase002')
28 
29 #打印sheet的名称,行数,列数
30 
31     print(sheet.name,sheet.nrows,sheet.ncols)
32 
33 #获取整行或者整列的值
34 
35     rows=sheet.row_values(2)#第三行内容
36 
37     cols=sheet.col_values(1)#第二列内容
38 
39     print(cols,rows)
40 
41 #获取单元格内容
42 
43     print(sheet.cell(1,0).value.encode('utf-8'))
44 
45     print(sheet.cell_value(1,0).encode('utf-8'))
46 
47     print(sheet.row(1)[0].value.encode('utf-8'))
48 
49 #打印单元格内容格式
50 
51     print(sheet.cell(1,0).ctype)
52 
53 if __name__ == '__main__':
54     read_excel()

运行结果:

 

4.读取pdf文件(暂不研究)

 

转载于:https://www.cnblogs.com/zhuzhubaoya/p/9264061.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值