python爬取内容写入word_读取word文档并提取和写入数据(基于python 3.6),,#!/usr/bin...

读取word文档并提取和写入数据(基于python 3.6),,#!/usr/bin#!/usr/bin/python3

# -*- coding: utf-8 -*-

# @File : delete_file

# @Author : moucong

# @Date : 2018/4/1 16:33

# @Software: PyCharm

#读取docx中的文本代码示例

import docx

import re

#获取文档

file=docx.Document("E:\\python_word\\word.docx")

print("段落数:"+str(len(file.paragraphs))) #输出段落数

file_word = docx.Document()

#输出每一段的内容

for para in file.paragraphs:

print(para.text)

#输出段落编号及段落内容

para_data = []

for i in range(len(file.paragraphs)):

# for j in map(lambda x:x.split(‘ ‘),file.paragraphs[i].text):

para_single = file.paragraphs[i].text.split(‘ ‘)

while ‘‘ in para_single: # 移除空格

para_single.remove(‘‘)

# para_data.append(para_single)

for data_number in range(len(para_single)):

data_num = re.findall(r"\d", para_single[data_number])

data_num = ‘‘.join(data_num)

para_data.append(data_num + ‘ ‘)

file_word.add_paragraph(para_data)

file_word.save("E:\\python_word\\number.docx")

读取word文档并提取和写入数据(基于python 3.6)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值