时隔好多天终于有博客可写了,经过了长时间的熬夜加班,做到了用python把word里的关键字提取到Excel里。
代码:class lala:
import docx
from docx import Document
from docx.shared import Inches
import xlrd#读取
import xlwt#写入
#from xlutils.copy import copy
import xlrd
import xlwt
from xlutils.copy import copy
from xlwt import Style
import zipfile
import os
import shutil
path=“C:\Users\86135\Desktop\PPARGS.docx”
zip_path = “C:\Users\Administrator\Desktop\Python_office\Python_office.zip”
tmp_path = “C:\Users\Administrator\Desktop\Python_office”
store_path = “C:\Users\Administrator\Desktop\Python_office”
document = Document(path) #读入文件
print(“段落数:”+str(len(document.paragraphs)))
for para in document.paragraphs:
print(para.text)
tables = document.tables #获取文件中的表格集
table = tables[0]#获取文件中的第一个表格z
data=[]
datta=[]
for i in range(0,len(table.rows)):#从表格第1行开始循环读取表格数据
data.append(table.cell(i,1).text)#cell(i,0)表示第(i+1)行第1列数据,以此类推
print(data)
for para in document.paragraphs:
datta.append(para.text)
print(datta)
def write_excel_xls(path, sheet_name, value):
index = len(value) # 获取需要写入数据的行数
workbook = xlwt.Workbook() # 新建一个工作簿
sheet = workbook.add_sheet(sheet_name) # 在工作簿中新建一个表格
for i in range(0, index):
for j in range(0, len(value[i])):
sheet.write(i, j, value[i][j]) # 像表格中写入数据(对应的行和列)
workbook.save(path) # 保存工作簿
print(“xls格式表格写入数据成功!”)
def write_excel_xls_append(path, value):
index = len(value) # 获取需要写入数据的行数
workbook = xlrd.open_workbook(path) # 打开工作簿
sheets = workbook.sheet_names() # 获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格
rows_old = worksheet.nrows # 获取表格中已存在的数据的行数
new_workbook = copy(workbook) # 将xlrd对象拷贝转化为xlwt对象
new_worksheet = new_workbook.get_sheet(0) # 获取转化后工作簿中的第一个表格
for i in range(0, index):
for j in range(0, len(value[i])):
new_worksheet.write(i+rows_old, j, value[i][j]) # 追加写入数据,注意是从i+rows_old行开始写入
new_workbook.save(path) # 保存工作簿
print(“xls格式表格【追加】写入数据成功!”)
def read_excel_xls(path):
workbook = xlrd.open_workbook(path) # 打开工作簿
sheets = workbook.sheet_names() # 获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格
for i in range(0, worksheet.nrows):
for j in range(0, worksheet.ncols):
print(worksheet.cell_value(i, j), “\t”, end="") # 逐行逐列读取数据
print()
datas=xlrd.open_workbook(‘C:\Users\86135\Desktop\PPARG.xlsx’)
table=datas.sheets()[0]
wb=xlwt.Workbook(encoding=‘ascii’)
ws=wb.add_sheet(‘wg’)
value_title = [[“产品名称”, “产品货号”, “产品规格”, “单价”, “单次最大供货量”,“产地”,“反映种属”,“敏感性”,“MW(kDa)”,“来源宿主”,“产品应用”,“稀释度”,“运输条件”,“存储条件”,“Entrez-Gene Id”,“Swiss-Prot Acc.”],]
value1=[data]
for i in range(1,len(value_title[0])):
ws.write(0,i,label=value_title[0][i])
for i in range(1,len(value1[0])):
ws.write(1,i,label=value1[0][i])
wb.save(‘D://shuju.xls’)
2019.09.20
最新推荐文章于 2022-06-07 16:37:21 发布