自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 关于爬虫比较常用的正则表达式

想进一步进行了解正则表达式的用法可以打开开源中国提供的正则表达式测试工具“http://tool.oschina.net/regex/”,进行测试。关于正则表达式,实际就是处理字符串的强大工具。它具有自己的语法结构,通过特定的语法结构,我们可以实现字符串的检索,替换和匹配都不在话下。接下来更加重要的内容,同时也是爬冲当中用的非常多的贪婪匹配和惰性匹配(非贪婪匹配)有一些常用的正则常用匹配规则。

2023-10-21 16:12:54 19

原创 HTTP请求过程

协议:为了使两个计算机之间能够通信而立下的君子协议,类似的还有很多,比如:TCP/IP,HTTP,SMTP协议等。HTTP协议, Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(www:World Wide Web)服务器传输超文本到本地浏览器的传送协议.直白点儿,就是浏览器和服务器之间的数据交互遵守的就是HTTP协议. 协议,超文本传输协议(超文本传输协议)的缩写,是用于从万维网)(WWW:万维网)服务器传输超文本到本地浏览器的传送协议。

2023-10-16 15:14:30 13

原创 浏览器工具的使用

这边便是我们经常需要去查找重要信息的地方,Headers里面包含了许多东西,首先是 General 部分, Request URL 为请求的 URL , Request Method 为请求的方法, Status Code 为响应状态码, Remote Address 为远程服务器的地址和端口, Referrer Policy 为 Referrer 判别策略。我们用chrome浏览器的开发者模式(F12)下的Network监听组来进行演示,它可以显示访问当前页面请求下所发生的所有网络请求和响应。

2023-10-16 12:38:48 31

原创 Web请求过程剖析

首先我们以百度浏览器为例子,当我们在百度浏览器当中输入网址的时候,其实我们是作为客户端向百度的服务器发出请求,服务端接收到了请求后,然后加载一些数据,再返回给浏览器,浏览器再显示给我们,就是我们所看到的页面。这是最简单的一种,在我们请求服务器的时候,服务器直接把所有数据都写到HTML当中,我们浏览服务器的时候,就能直接拿到带有数据的HTML。进一步去看,服务器返回给浏览器的不直接是页面,而是页面源代码(由HTML,CSS,JS组成),然后交给浏览器把页面源代码进行执行,最终把执行的结果展示给用户。

2023-10-11 19:50:23 49

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除