- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 照葫芦画瓢之python爬虫系列----(3)一分钟快速爬取想要的内容
感谢:https://zhuanlan.zhihu.com/p/21255850,提供素材,让我可以照葫芦画瓢在这里先总结一下爬虫的步骤:1.确定要爬取的网页源2.借助集搜客的GMS工作台生成规则3.编写几行代码,点击开始运行其实我们的大部分时间是花在生成规则这样的一个步骤上下载并安装好集搜客,打开ms谋数台,在浏览器中选中要爬取的内容,并为之命名,点击工作台的测试即可看到效果。然后生成的规则就在...
2018-05-29 18:29:11 833
原创 docker部署应用----tomcat、nginx、mysql
安装应用的介绍:我们现在一般的小型服务器都是安装一个mysql,作为我们的一个数据库使用,安装一个tomcat作为一个应用服务器,nginx作为一个图片服务器或者其他的。也就是说如果我们刚刚拿到一台只有操作系统的服务器时,我们首先做的是先下载这三个应用,然后为他们配置,测试,在使用。这样一个步骤其实我们都已经经历过很多次了,虽然我们也会觉得麻烦,也想着使用一个系统镜像来解决这个问题。但是我们总是遇...
2018-05-26 11:16:25 1267
原创 docker-------我认识的docker
一、简介Docker 是一个开源的应用容器引擎,是一个轻量级容器,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。一个完整的Docker由以下几个部分组成: (1)dockerClient客户端 (2)Docker Daemon守护进程 (3...
2018-05-26 10:37:49 238
原创 照葫芦画瓢之python爬虫系列----(2)初次爬取简单的动态网页数据(网易、QQ音乐排行榜)
感谢提供素材的同学,无论好坏,高低,我都真心佩服你:参考文章地址:https://mp.weixin.qq.com/s/AXr8BjR_tU-E9YBo-mLVlg 爬取网易云音乐榜单在上一篇的文章中,总结了爬虫的四个步骤,之后的爬虫也大都会按照这四个步骤去分析。因为这样分析更有利于我们去看清问题所在,看看我们爬虫所面对的难点是在那个步骤上,然后我们也可以做到心里有数,让我们去学习更加有目标。在这...
2018-05-25 15:23:04 1607
原创 照葫芦画瓢之python爬虫系列----(1)初次学习爬取简单的静态网页(京东顶部导航栏)
感谢提供素材的同学,无论好坏,高低,我都真心佩服你:参考文章地址:https://mp.weixin.qq.com/s/AXr8BjR_tU-E9YBo-mLVlg 爬虫的定义在这里就不多赘述。不过这里蛮赞同一个的观点:爬虫就是为了让大家可以共享互联网上的信息资源 爬取静态网页 爬取静态网页的思路是蛮简单的,因为是静态的网页,我们完全可以借助语言提供的一些工具去获取网...
2018-05-25 14:31:27 1366
struts2+hibernate实现简单的仿论坛功能
2017-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人