爬虫
文章平均质量分 86
Lamb!
这个作者很懒,什么都没留下…
展开
-
好用的抓包工具
它支持ARP, BPDU, or PVST, CDP, LLDP, IP, IGMP, UDP, TCP (stateless), ICMP (partly), DNS, RTP,RTP optionally RX-mode for jitter measurements,Syslog protocols。你还可以设置数据包数量和数据包之间的延迟,还可以在此工具中修改各种数据包内容。如果你是网络管理员,你可以使用此工具来测试你的网络。Libtins也是一个很好的工具,用于制作,发送,嗅探和解析网络数据包。原创 2023-08-21 10:09:09 · 383 阅读 · 0 评论 -
Python爬虫 爬取图片
我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。read()方法用于读取URL上的数据,向getHtml()函数传递一个网址,并把整个页面下载下来。在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。原创 2023-08-10 13:58:50 · 1740 阅读 · 0 评论 -
爬虫基本原理
简单来说互联网是由一个个站点和网络设备组成的大网,我们通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析、渲染,将丰富多彩的网页呈现我们眼前;爬取--->解析--->存储请求库:requests,selenium(可以驱动浏览器解析渲染CSS和JS,但有性能劣势(有用没用的网页都会加载);解析库:正则,beautifulsoup,pyquery存储库:文件,MySQL,Mongodb,Redis3、爬获校花网最后送给大家点福利吧import re。原创 2023-08-01 09:49:46 · 860 阅读 · 1 评论