nutch无法下载中文文件的问题比如:http://www.example.com/中文.pdf
wireshark抓包后发现是其无法正确encode中文。解决办法修改src/java/org/apache/nutch/fetcher/Fetcher.java 加上编码功能
附上
Fetcher.java:
nutch无法下载中文文件的问题比如:http://www.example.com/中文.pdf
wireshark抓包后发现是其无法正确encode中文。解决办法修改src/java/org/apache/nutch/fetcher/Fetcher.java 加上编码功能
附上
Fetcher.java: