今天在linux下想将html格式的文件转换成xml格式,便安装了HTML Tidy,但总是不成功,后来看到一篇文章,在
http://anduin.linuxfromscr
bzip2 -d tidy-cvs_20070326.tar.bz2
tar -xvf tidy-cvs_20070326.tar
cd tidy-cvs_20070326
./configure --prefix=/usr/local
make
make install
make clean
便安装成功了。
执行 tidy -asxhtml -numeric <index.html> index.xml
便可转换成功。html格式转成xhtml。也可反之:tidy -ashtml -numeric <index.xml> index.html
应该也有