自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

liwanyuanyuan的博客

程序员的自我修养

  • 博客(2)
  • 收藏
  • 关注

原创 通用爬虫实现的原理及过程

获取初始的URL。初始的URL地址可以人为地指定,也可以由用户指定的某个或某几个初始爬取网页决定。 根据初始的URL爬取页面并获得新的URL。获得初始的URL地址之后,先爬取当前URL地址中的网页信息,然后解析网页信息内容,将网页存储到原始数据库中,并且在当前获得的网页信息里发现新的URL地址,存放到一个URL队列里面。 从URL队列中读取新的URL,从而获得新的网页信息,同时在新网页中获取新...

2019-04-15 21:01:32 4813

原创 程序员新手上路之安装java-jdk环境

在学习大数据之前,首先要掌握的是汇编语言java,而学习java语言前必定要先安装环境,jdk的安装在我们上课期间有提到过,可是当时没有上心听讲,也就不知道如何安装jdk,在这次的学习中,老师指引我们如何进行jdk的安装,在一步步地按照老师所教的步骤操作的时候,发现有些问题,自己没能将中英文符号:分号没有注意到,以及在配置环境变量的时候,path里面的地址复制我没有把复制好的地址放在最前面,而且是...

2018-04-22 18:56:24 272

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除