使用过wget下载网页可能会出现网页乱码的问题

可以通过修改环境变量LANG 调整

常见的变量有 en_US.UTF-8;zh_CN.UTF-8;zh_CN.GBK。

如果现在下载文档存在乱码的情况,那么使用命令对文件进行处理,很有可能遇到无法处理的情况。

可以设置LANG为en_US.UTF-8 ,一般不会出现乱码的情况。


在对CSS时,需要判断一下文件类型,因为有 css文件问gzip压缩类型,


filename=`file $css |grep gzip`

if [ $filename != "" ]

   then

     mv $css $css.gz

     gzip -d css.gz

fi