爬虫
从小白开始学习爬虫
呦呦呦欸哟哟
摆烂失败
展开
-
爬虫入门10——Xpath数据解析方法
【代码】爬虫入门09——Xpath数据解析方法。原创 2023-07-09 00:49:39 · 786 阅读 · 0 评论 -
爬虫入门05——requests中的post请求
点击sug,点击标头,我们可以看见相关信息,如请求网址、请求方法、状态代码等。以百度翻译为例,我们如何输入内容后获取翻译后的结果呢。点击载荷,其中的kw就是我们所输入的需要翻译的内容。在翻译的框内输入内容,就以输入“你好”为例,点击预览可以看见其中有我们所需的翻译后的内容。还可以看见请求头User-Agent。我们可以看见,请求方法为POST。原创 2023-07-06 23:38:16 · 1278 阅读 · 0 评论 -
爬虫入门07——requests中携带cookie信息
【代码】爬虫入门07——requests中携带cookie信息。原创 2023-07-07 21:54:32 · 1460 阅读 · 0 评论 -
爬虫入门06——了解cookie和session
http请求是无状态的请求协议,不会记住用户的状态和信息,也不清楚你在这之前访问过什么而当网站需要记录用户是否登录时,就需要在用户登录后创建一些信息并且要把这些信息记录在当前用户的浏览器中,记录的内容就是cookie用户使用当前的浏览器继续访问这个服务器时,会主动携带这个网站设置的cookie信息cookie会在浏览器中记录信息,并且在访问时携带这个信息但在一些情况下 cookie无法在浏览器中记录信息①浏览器更换或删除cookie后, 信息丢失。原创 2023-07-07 20:57:07 · 1503 阅读 · 0 评论 -
爬虫入门02——认识爬虫
客户端浏览器:发起请求url: http:/ /www. baidu.com远程服务器:服务器响应内容 源代码(html, css, js)超文本传输协议(Hypertext Transfer Protocol,简称HTTP) 是应用层协议。HTTP是一种请求/响应式的协议,即一个客户端与服务器建立连接后,向服务器发送一个请求,服务器接到请求后,给予相应的响应信息。系统:Linux/windows/MacOs(我在使用的是windows)版本:Python3.7。原创 2023-07-06 17:52:35 · 1316 阅读 · 0 评论