爬虫
会飞的小凤梨
DO WHAT I WANT TO DO AND ENJOY!
展开
-
python爬虫之实战篇
# -*- coding: utf-8 -*- import code import re import urllib3 url = "https://sou.zhaopin.com/?jl=653&kw=Java%E5%BC%80%E5%8F%91&kt=3" user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88原创 2020-12-30 17:37:25 · 152 阅读 · 2 评论 -
python简易版爬虫
概念:网络爬虫,通过超链接(URL)爬取网页所有数据用于测试。 用途:在用户浏览网页的过程中,会看到许多图片、按钮、文字等(如http://image.baidu.com/ )这个过程其实就是用户输入网址之后,经过DNS服务器找到服务器主机,向服务器发出一个请求,服务器经过解析之后,返回给用户的浏览器 HTML、JS、CSS 等文件,浏览器解析出来,用户便可以看到形形色色的图片、文字了。爬虫爬取的就是这些内容,再通过分析和过滤这种HTML代码,实现对文字和图片的获取。 HTTP和HTTPS HTTP协议(H原创 2020-12-25 17:27:30 · 234 阅读 · 0 评论