自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

古韦的专栏

古韦 CSDN认证博客专家 CSDN认证企业博客

码龄15年

42: 原创

18万+: 周排名

219万+: 总排名

31万+: 访问

: 等级

3213: 积分

75: 粉丝

93: 获赞

17: 评论

372: 收藏

私信

关注

热门文章

分类专栏

DataMining 18篇
Algorithm 10篇
Java 16篇
AssemblyLanguage 1篇
R 17篇
Interview 3篇
SQL 3篇
Camera 1篇
Hadoop 10篇
Network 1篇
Jsoup 1篇
Nutch 1篇
SearchEngine 2篇
DesignPatterns 1篇
maven 1篇

最新评论

R语言矩阵(matrix)详解
bun_神的口袋: 写的不明不白，乱七八糟
java变量默认值
学习进行时！: 想问一下，我给new一个局部变量数组，系统是会初始化，这是怎么回事呢
层次聚类之AGNES算法和DIANA算法
李贽: DIANA算法的时间复杂度是多少？是否适合大数据运算？
java变量默认值
m0_58430482: 挺不错的，占个沙发
Java中try,catch,finally的用法
empty_coder: "如果对于新抛出的异常没有写try的话，则要在方法后面声明抛出异常"，这里的 try 应该改成 catch

最新文章

Nutch

关注

关注数：文章数：1 文章阅读量：1329 文章收藏量：0

作者: 古韦

这个作者很懒，什么都没留下…

展开

nutch+mysql gb2312网页源代码中文乱码

问题描述：将nutch爬的网页源代码存在mysql中，网页编码为gb2312的网页中文乱码，其他编码暂未发现问题。因为nutch对爬下的网页源代码content不作任何处理，仅仅保存，而我的mysql编码设置的为utf-8，所以会显示乱码。现在需要处理网页源代码，取出指定数据，那么java程序如何将gb2312中文乱码的网页源代码转化为非乱码。解决：其实采用ResultSe

原创 2014-12-16 14:35:18 · 1329 阅读 · 0 评论