不经常写博客,俗话说好记性不如烂笔头,今天闲下来就把这几天的东西给总结一下供大家参考,也是在这里记录一下免得以后我自己给忘了。
首先我的目的是word转换成html,当然有一些工具是可以直接将word直接将word转换成html的,但是效果都不好,而且css都是内嵌到html中去的,所以就没有采用直接转换的方法。下面我介绍一下我的方法,当然你也可以截取其中的一个步骤来完成你的需求。
一、word的拆分
word文档已将到达了一定的量级,所以手动ctrl+c,ctrl+v会很累的,很庆幸word提供了文档拆分的功能,但是隐藏的比较深。首先规定好标题(就是显示级别),按照级别来分文档 --> 切换到大纲视图 --> 在“显示级别”一栏选择你要分割的级别 --> 然后用鼠标选中你要分割的文档 --> 点击“显示文档” --> 接着点击创建 --> ctrl+s保存就OK。切换到文档所在目录,就可以看到已经分割好的文档了。
二、word批量转rst
批量的工作是我写了一py脚本实现的,最重要的还是word转rst,在这里有一个工具“pandoc”,这个是一个非常强大的文档格式转换工具,几乎无所不能,所以word转rst也是小意思。在文末我会将转换脚本放到下边。
三、rst转html
在这里也是使用工具,sphinx和rst当然是绝配,将rst和css融合,一条命令就可以将rst转换成非常漂亮的html,详细的sphinx教程我在这里就不详细说了,因为输入关键字网上一大堆。
四、word批量转rst脚本
# coding=utf-8
import os
path = "../word"
for root, dir, files in os.walk(path):
print root
for filename in files:
print filename
prefix = os.path.splitext(filename)[0]
print "将" + filename + "转换成rst格式"
srcfile = root + "/" + filename
desfile = root + "/" + prefix+".rst"
command = "pandoc -t rst " + srcfile + " -o " + desfile
print srcfile, desfile
os.system(command)
print "转换成功"
print "============================="