妹子想成为程序媛,今天主动问我教什么。
答曰:一起讨论先。
今天在反复看爬虫的知识,所以就从爬虫开始吧
从爬虫学起
对于同一个问题思路不同差异很大。
爬虫-一种程序用来保存别人的网页。我们每个网页都保存,我们的策略是从一个网页开始一个一个打开-深度优先。-妹子表示几万个什么鬼
没有继续讲优化的事情
网络基础知识
一个网址的组成:
http://yuqing.people.com.cn/n1/2016/1222/c394782-28970110.html
//拆分成:
http://
协议
yuqing.people.com.cn
服务器及域名
路径-就像本地文件
/n1/2016/1222/
c394782-28970110.html
文件名
没有讲IP的知识
什么是协议?
什么是万维网-超文本文件-没有将格式,只讲了用途
什么是Root根目录
协议都有哪些?
演示一下ftp协议传输文件
https加密协议
域名的知识
没有说几类
com
cn
us
jp
org
www是个服务器的名字
默认:协议,服务器,端口,路径,文件
http://
端口的概念
项目 | 默认 |
---|---|
服务器名 | www |
端口 | 443,80 |
路径 | /根目录 |
文件 | index.html、index.htm、index.php |
妹子困了
……
醒了继续
死亡之PING
一直求回复
握手攻击
为什么需要三次握手?
漏洞
攻击
反制
再改进
……