python爬虫
文章平均质量分 76
微若蓝
这个作者很懒,什么都没留下…
展开
-
爬取樱花动漫
这里面有一部分代码,需要改一改,但已经不影响最后的结果(可以将视频爬下来),今天太累了,这个代码写了快三个小时.一是不用就生,二是确实有不知道的不知道的1.如果网页源代码找不到m3u8网址,或不能直接看到是那个网址跳转到m3u8,就去看看js的网址,里面包不包含2.如何将ts文件拼接在一起''' 先分析,第一步 我要爬取的网页地址:http://www.imomoe.la/view/8024.html 我要找到每一集的链接,网页源代码里面有,所以直接xpath拿了就行原创 2021-08-10 23:06:55 · 6093 阅读 · 1 评论 -
python爬虫
爬虫通过编写程序来获取互联网上的资源web请求过程解析1.服务器渲染:在服务器那边直接把数据和HTML整合在一起,统一返回给浏览器特点:在页面源代码中能看到数据2.客户端渲染:第一次请求只要一个HTMl骨架,第二次请求拿到数据,进行数据展示. 特点:在页面源代码中看不到数据(数据在第二次请求中)所以在看不到数据的时候不要慌,再往下找找HTTP协议协议:就是两个计算机之间为了能够流畅的进行沟通而设置的一个君子协议.常见的协议有TCP/IP,SOAP协议,HTTP协议,SMTP协议等等HTTP原创 2021-07-22 17:33:03 · 6030 阅读 · 12 评论