自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Spring Lee的博客

哈哈哈,坚持,每天学习一点,做的东西

  • 博客(8)
  • 收藏
  • 关注

原创 网络安全-信息收集专题

 渗透测试:渗透测试,是为了证明网络防御按照预期计划正常运行而提供的一种机制。不妨假设,你的公司定期更新安全策略和程序,时时给系统打补丁,并采用了漏洞扫描器等工具,以确保所有补丁都已打上。如果你早已做到了这些,为什么还要请外方进行审查或渗透测试呢?因为,渗透测试能够独立地检查你的网络策略,换句话说,就是给你的系统安了一双眼睛。而且,进行这类测试的,都是寻找网络系统安全漏洞的专业人士。 ...

2018-06-22 23:08:14 3668

原创 大鹏教你python数据分析

 出差中…………,换pc了,没有开发环境,看看其他口味的课程 数据工作流抛出问题——数据——数据研究——问题结论——解决方案用py用py来分析数据,结合很多包,py类比手机,安装不同app就是安装不同的包知道2神器,火车头,Gephi。数据采集与分析火车头简单教程:A、网址识别  (*)强大的变量,和bs4一样,唯一定位即可原理:超链接 ...

2018-06-13 14:09:02 1249

原创 黑马python2.7的爬虫4-Scrapy框架

期末考试了,出差,不晓得有没有时间写哦,先开个头

2018-06-10 18:36:12 546

转载 Python爬虫黑科技(经验)

"作为一名爬虫工程师,你最需要关注的,是数据的来源"原文:https://www.jb51.net/article/90114.htm霍夫曼编码压缩算法1.最基本的抓站import urllib2content = urllib2.urlopen('http://XXXX').read()2.使用代理服务器这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受...

2018-06-10 10:48:42 4419 3

原创 黑马python2.7的爬虫3- 动态HTML处理和机器图像识别

关于爬虫部分一些建议:尽量减少请求次数,能抓列表页就不抓详情页,减轻服务器压力,程序员都是混口饭吃不容易。不要只看 Web 网站,还有手机 App 和 H5,这样的反爬虫措施一般比较少。实际应用时候,一般防守方做到根据 IP 限制频次就结束了,除非很核心的数据,不会再进行更多的验证,毕竟成本的问题会考虑到。(代理ip)如果真的对性能要求很高,可以考虑多线程(一些成熟的框架如 Scrapy都已支持)...

2018-06-10 10:31:59 355

原创 黑马python2.7的爬虫2-非结构化数据与结构化数据提取

非结构化数据与结构化数据提取

2018-06-09 16:39:20 3409

原创 黑马python2.7的爬虫1- 爬虫原理与数据抓取

1、使用的IDE和编辑器IDE:PyCharm 、 Visual Studio编辑器:Vim 、Sublime Text等抓包工具:fiddler python需要导入各种各样强大的库教程基于python2.7版本的2、Python爬虫,我们需要学习的有1. Python基础语法学习(基础知识)2. HTML页面的内容抓取(数据抓取)3. HTML页面的数据提取(数据清洗)4. Scrapy框架以...

2018-06-09 16:35:47 1466

原创 马哥:linux云计算从入门到精通笔记

前言Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。互联网Linux运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够7×24小时为用户提供高质量的服务。运维的职责覆盖了产品从设计到发布、运行维护、变更升级及至下线的生命周期。                              ...

2018-06-03 21:11:14 14430 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除