文档格式转换

 不经常写博客,俗话说好记性不如烂笔头,今天闲下来就把这几天的东西给总结一下供大家参考,也是在这里记录一下免得以后我自己给忘了。

    首先我的目的是word转换成html,当然有一些工具是可以直接将word直接将word转换成html的,但是效果都不好,而且css都是内嵌到html中去的,所以就没有采用直接转换的方法。下面我介绍一下我的方法,当然你也可以截取其中的一个步骤来完成你的需求。

一、word的拆分

    word文档已将到达了一定的量级,所以手动ctrl+c,ctrl+v会很累的,很庆幸word提供了文档拆分的功能,但是隐藏的比较深。首先规定好标题(就是显示级别),按照级别来分文档 --> 切换到大纲视图 --> 在“显示级别”一栏选择你要分割的级别 --> 然后用鼠标选中你要分割的文档 --> 点击“显示文档” --> 接着点击创建 --> ctrl+s保存就OK。切换到文档所在目录,就可以看到已经分割好的文档了。

二、word批量转rst

     批量的工作是我写了一py脚本实现的,最重要的还是word转rst,在这里有一个工具“pandoc”,这个是一个非常强大的文档格式转换工具,几乎无所不能,所以word转rst也是小意思。在文末我会将转换脚本放到下边。

三、rst转html

    在这里也是使用工具,sphinx和rst当然是绝配,将rst和css融合,一条命令就可以将rst转换成非常漂亮的html,详细的sphinx教程我在这里就不详细说了,因为输入关键字网上一大堆。

四、word批量转rst脚本

# coding=utf-8


import os


path = "../word"
for root, dir, files in os.walk(path):
    print root
    for filename in files:
        print filename
        prefix = os.path.splitext(filename)[0]
        print "将" + filename + "转换成rst格式"
        srcfile = root + "/" + filename
        desfile = root + "/" + prefix+".rst"
        command = "pandoc -t rst " + srcfile + " -o " + desfile
        print srcfile, desfile
        os.system(command)
        print "转换成功"
        print "============================="



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值