Python
文章平均质量分 75
Python学习
想七想八不如11408
一只积极进取的菜鸟
展开
-
【Python】【Scrapy 爬虫】理解HTML和XPath
一个 URL 由不同的部分组成,其中一些是必须的,而另一些是可选的。http是协议。它表明了浏览器必须使用何种协议。它通常都是 HTTP 协议或是 HTTP 协议的安全版,即 HTTPS。Web 需要它们二者之一,但浏览器也知道如何处理其他协议,比如(打开邮件客户端)或者(处理文件传输)。是域名。它表明正在请求哪个 Web 服务器。或者,可以直接使用IP address,但是因为它不太方便,所以它不经常在网络上使用。:80是端口。它表示用于访问 Web 服务器上的资源的技术“门”。原创 2024-05-25 19:30:16 · 951 阅读 · 0 评论 -
【Python】Scrapy 爬虫(简单了解)
name属性:一个Scrapy项目中可能有多个爬虫,每个爬虫的name是其自身的唯一标识,在一个项目中不能有重名的爬虫。 start_urls属性:一个爬虫总要从某些页面开始爬取,我们称这样的页面为起始爬取点,start_urls属性用来设置一个爬虫的起始爬取点。 parse方法:当一个页面下载完成后,Srapy引擎会回调一个我们指定的页面的解析函数(默认为parse方法)解析页面。一个页面解析函数通常需要完成两个任务:1)提取页面中数据(使用xpat原创 2024-03-31 13:02:08 · 829 阅读 · 0 评论 -
【Python】爬虫入门
譬如:418就说明网站只对浏览器提供服务,而我们用的是程序,就需要把程序伪装成浏览器。原创 2024-01-02 14:30:10 · 1162 阅读 · 0 评论 -
【Python】集合与字典
将输入的名字去重,同时按照输入顺序输出。原创 2023-11-17 17:48:21 · 118 阅读 · 0 评论 -
【Python】列表、集合、字典基础知识
列表中元素的类型可以不同,列表内部存储方式是元素值存储在不连续的空间,但是把他们的指针存在一块连续的空间。原创 2023-11-03 18:12:04 · 184 阅读 · 0 评论 -
【Python】输出、列表练习
之前总觉得python简单,不当回事,直到自己动手连输出都写不出来。。于是开一篇专门练python的博客。原创 2023-10-08 10:05:13 · 612 阅读 · 0 评论