2019.09.20

时隔好多天终于有博客可写了,经过了长时间的熬夜加班,做到了用python把word里的关键字提取到Excel里。
代码:class lala:
import docx
from docx import Document
from docx.shared import Inches
import xlrd#读取
import xlwt#写入
#from xlutils.copy import copy
import xlrd
import xlwt
from xlutils.copy import copy
from xlwt import Style
import zipfile
import os
import shutil
path=“C:\Users\86135\Desktop\PPARGS.docx”
zip_path = “C:\Users\Administrator\Desktop\Python_office\Python_office.zip”
tmp_path = “C:\Users\Administrator\Desktop\Python_office”
store_path = “C:\Users\Administrator\Desktop\Python_office”
document = Document(path) #读入文件
print(“段落数:”+str(len(document.paragraphs)))
for para in document.paragraphs:
print(para.text)
tables = document.tables #获取文件中的表格集
table = tables[0]#获取文件中的第一个表格z
data=[]
datta=[]
for i in range(0,len(table.rows)):#从表格第1行开始循环读取表格数据
data.append(table.cell(i,1).text)#cell(i,0)表示第(i+1)行第1列数据,以此类推
print(data)
for para in document.paragraphs:
datta.append(para.text)
print(datta)
def write_excel_xls(path, sheet_name, value):
index = len(value) # 获取需要写入数据的行数
workbook = xlwt.Workbook() # 新建一个工作簿
sheet = workbook.add_sheet(sheet_name) # 在工作簿中新建一个表格
for i in range(0, index):
for j in range(0, len(value[i])):
sheet.write(i, j, value[i][j]) # 像表格中写入数据(对应的行和列)
workbook.save(path) # 保存工作簿
print(“xls格式表格写入数据成功!”)
def write_excel_xls_append(path, value):
index = len(value) # 获取需要写入数据的行数
workbook = xlrd.open_workbook(path) # 打开工作簿
sheets = workbook.sheet_names() # 获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格
rows_old = worksheet.nrows # 获取表格中已存在的数据的行数
new_workbook = copy(workbook) # 将xlrd对象拷贝转化为xlwt对象
new_worksheet = new_workbook.get_sheet(0) # 获取转化后工作簿中的第一个表格
for i in range(0, index):
for j in range(0, len(value[i])):
new_worksheet.write(i+rows_old, j, value[i][j]) # 追加写入数据,注意是从i+rows_old行开始写入
new_workbook.save(path) # 保存工作簿
print(“xls格式表格【追加】写入数据成功!”)
def read_excel_xls(path):
workbook = xlrd.open_workbook(path) # 打开工作簿
sheets = workbook.sheet_names() # 获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格
for i in range(0, worksheet.nrows):
for j in range(0, worksheet.ncols):
print(worksheet.cell_value(i, j), “\t”, end="") # 逐行逐列读取数据
print()
datas=xlrd.open_workbook(‘C:\Users\86135\Desktop\PPARG.xlsx’)
table=datas.sheets()[0]
wb=xlwt.Workbook(encoding=‘ascii’)
ws=wb.add_sheet(‘wg’)
value_title = [[“产品名称”, “产品货号”, “产品规格”, “单价”, “单次最大供货量”,“产地”,“反映种属”,“敏感性”,“MW(kDa)”,“来源宿主”,“产品应用”,“稀释度”,“运输条件”,“存储条件”,“Entrez-Gene Id”,“Swiss-Prot Acc.”],]
value1=[data]
for i in range(1,len(value_title[0])):
ws.write(0,i,label=value_title[0][i])
for i in range(1,len(value1[0])):
ws.write(1,i,label=value1[0][i])
wb.save(‘D://shuju.xls’)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值