- 博客(2)
- 资源 (11)
- 收藏
- 关注
原创 pdf, doc批量转换txt的问题可以问我
连续加了2个星期的班,好累。幸好写出了几个程序,要不然岂不是很惨。这几天一直在研究格式转换的问题,pdf2txt, doc2txt的程序已经都能运行,虽然不完美,但可以解决绝大多数问题。借用了开源工具xpdf的pdftotext,非常感谢。最满意的地方是批量转换时效率较高,pdf2txt可以达到4秒/本,每本几百页,已经很快了,还要拆分txt,我容易嘛我。pdf如果嵌入字体子集,或文字已转换为路径,还无法提取,在网上也没发现谁成功过。doc2txt本来想用vb的,后来才发现vc也可以,我汗。。。
2011-05-16 17:28:00 1412 5
原创 xml验证:schema文件的写法
<br />下面两个文件互相包含,可以解决绝大部分xml的语法问题:<br /> <br />test.xsd内容如下:<br /><?xml version="1.0" encoding="UTF-8"?><br /><xs:schema xmlns="http://www.idpf.org/2007/opf" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xs="http://www.w3.org/2001/XMLSchema" targetName
2011-05-03 14:03:00 746
Win32OpenSSL-0_9_8g.exe
2008-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人