描述一下下列符号在正则表达式中的含义?/HTTP与HTTPS的区别?/七层,五层,四层协议?/简述为什么会用到代理?/

描述一下下列符号在正则表达式中的含义

( . ? * + [a-z] {n,m} ^ | \d)

. 点匹配除了换行符"\n"之外的任何单个自字符
?非贪婪匹配匹配0个或1个与{0,1}等价
* 匹配前面的子表达式任意次
+ 匹配前面的子表达式一次或多次(大于等于1次)
[a-z] 字符串范围,匹配指定范围(a-z)内的任意字符
{n,m} 匹配子表达式最少匹配n次且最多匹配m次
^ 匹配输入字行首,必须以匹配字符开头
| 将两个匹配条件进行逻辑“或”(or)运算
\d 匹配一个数字字符。等价于[0-9]

HTTP与HTTPS的区别?

 1、https协议需要到ca申请证书,一般免费证书较少,因而需要一定费用。
 2、http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。
 3、http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。
 4、http的连接很简单,是无状态的;HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、
 身份认证的网络协议,比http协议安全。

七层协议?五层协议?四层协议?

七层:应用层  表示层 会话层  传输层  网络层  数据链路层 物理层
五层:应用层、运输层、网络层、数据链路层和物理层。
四层:应用层、运输层、网际层和网络接口层。

简述为什么会用到代理?

1.一些网站会有相应的反爬虫措施,例如很多网站会检测某一段时间某个IP的访问次数,
如果访问频率太快以至于看起来不像正常访客,它可能就会会禁止这个IP的访问。
所以我们需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,
依然可以换个IP继续爬取。必要的时候可以自己写ip池.
2.使用了ip后,客户端发起一个请求会先经过代理服务器,
然后由代理服务器发起请求到目标服务器,目标服务器接收到请求,
返回响应结果给代理服务器,代理服务器将响应结果交给客户端

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值