- 博客(4)
- 资源 (11)
- 收藏
- 关注
原创 用Java语言将utf8编码的汉字还原
用Java语言将utf8编码的汉字还原作者:雨水,时间:2013-12-30博客地址:http://blog.csdn.net/gobitan说明:本文介绍了如何用Java将utf-8编码的汉字还原 在网页中的JavaScript中的中文都是经过编码了的,通过浏览器的”查看网页源代码”只能看到类似\u4e2d\u56fd的编码。下面记录了用Java语言解码的过程。import
2013-12-30 18:03:12 14437 3
原创 Hadoop学习笔记:Apache Hadoop生态系统
Hadoop学习笔记:Apache Hadoop生态系统作者:雨水,时间:2013-12-9 博客地址:http://blog.csdn.net/gobitanHadoop从诞生至今已经发展成为一个大数据相关的庞大的软件生态系统。这里收集整理了跟Hadoop相关的Apache下的开源项目,以供后续分析研究。Apache HadoopHadoop是一个大数据处理框架,它可用于从单台到
2013-12-09 21:05:18 6909
原创 Nutch1.7学习笔记8:CrawlDb源代码分析
Nutch1.7学习笔记8:CrawlDb源代码分析作者:雨水,时间:2013-12-3博客地址:http://blog.csdn.net/gobitanCrawlDb分析功能:将解析出来的Segment中的URL更新至CrawlDb。update方法update方法的参数包含四个参数:(1) CrawlDb数据库的路径,如crawl/crawldb;(2) Segme
2013-12-03 20:00:50 3465 2
原创 Nutch1.7学习笔记7:Robots协议处理流程
Nutch1.7学习笔记7:Robots协议处理流程作者:雨水,时间:2013-12-1博客地址:http://blog.csdn.net/gobitan说明:通常来说,网络爬虫应该遵循网站所描述的robots协议。因此,任何网络爬虫都有关于robots协议部分的处理。分析入口:Robot相关处理的入口位于Fetcher.java的L676,如下所示:BaseRobotRules
2013-12-01 20:35:38 3575 1
mina2.07相关的依赖库jar资源
2014-08-25
FFmpeg4Android-master-2014-04-01.zip
2014-04-01
Android的Intent方式拍照源代码
2013-06-24
用TCP∥IP进行网际互联(第一卷:原理协议与结构).pdf
2010-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人