- 博客(3)
- 资源 (4)
- 收藏
- 关注
原创 一个简单的Java网络爬虫实现思路
什么是网络爬虫 百度百科上定义为自动抓取信息的程序或脚本。在实际生产环境中,爬虫可以按照抓取方式分为通用爬虫和聚焦爬虫。常见的比如搜索引擎(比如百度,Google)这类抓取网页的爬虫,这类爬虫主要是抓取各类网站和网页的URL地址和信息,这一类爬虫也叫做通用爬虫。而针对一个特定网站的爬虫叫做聚焦爬虫。而规模上又可以分为单体爬虫和分布式爬虫。 当然从其他角度来说爬虫也可以分为批...
2019-01-21 23:22:36 1635
原创 ArrayList源码解析
1.类图 文章使用的源码是JDK 1.8.0_181版本 分析主要从下面几个点入手: 体系结构 构造方法 和LinkedList,Vector的区别 扩容 2.ArrayList的体系结构 ArrayList直接实现了下面这几个接口: List 有序集合接口,定义了一些基础方法,自实现了sort方法和replaceAll方法 RandomAccess 标...
2019-01-07 23:18:58 153
原创 CentOS7下使用RPM方式安装完Jenkins第一次访问需要输用户名密码问题
参考内容:http://blog.51cto.com/12629984/1980578 使用RPM方式安装完jenkins之后第一次访问就要输入用户名和密码 Jenkins的默认工作目录是:/var/lib/jenkins 进入users/admin 目录下,找到config.xml文件,使用 vim config.xml 命令编辑文件 使用下面这一串字符替换 pa...
2019-01-01 23:28:00 1046 1
gitToc.exe
2020-04-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人