nutch无法下载中文文件的问题[解决]

nutch无法下载中文文件的问题比如:http://www.example.com/中文.pdf

 

wireshark抓包后发现是其无法正确encode中文。解决办法修改src/java/org/apache/nutch/fetcher/Fetcher.java 加上编码功能

 

附上

Fetcher.java:

 

 

 

阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭