Read DRM info from docx

# Use win32com package or docx package
# we use docx here
import win32com

import docx
from docx import Document

# 0. setting
WorkPath = 'D:/Script/DRM/'
File = 'DRM.docx'
FilePath=WorkPath+File
# 1.
def MatchStrList(StrChecked,StrKeyword):
    LenResult=min(len(StrChecked),len(StrKeyword))
    for i in range(min(len(StrChecked),len(StrKeyword))):
        LenResult=LenResult*len(re.findall(StrKeyword[i],StrChecked[i]))
        #should not contain space in StrKeyword cause the regular expression only pick up \s as space
        #if one of Strlist is null, return 0
        #if one of index is not match also return 0
    return LenResult
def ReadDocxFile(FilePath):
    try:
        DocxFile = docx.Document(FilePath)
    except IOexception as e:
        return e
    DRM={}
    Layers={}
    for p in DocxFile.paragraphs:
        if ((len(p.text)>0)& (MatchStrList([p.text],['Manual&
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值