- 博客(8)
- 收藏
- 关注
原创 网络爬虫之基础库的使用(三)
网络爬虫之基础库的使用(三)正则表达式正则表达式是处理字符串的工具,它有特定的语法结构,可以实现字符串检索,替换,匹配验证等常用匹配规则模式描述\w匹配字母,数字和下划线\W与\w相反,即不匹配\s匹配空白字符,等价于[\t\n\r\f]\S匹配非空白字符\d匹配任意数字,即[0-9]\D匹配非数字字符\A匹配字符串...
2020-03-30 18:26:05 161
原创 网络爬虫之基础库的使用(二)
网络爬虫之基础库的使用(二)requests 库基本操作# 实例import requestsr = requests.get('https://www.baidu.com') # 得到一个Response对象print(type(r)) # 类型print(r.status_code) # 状态码print(type(r.text)) # 响应体类型print(r.t...
2020-03-29 22:19:52 133
原创 网络爬虫之基础库使用(一)
网络爬虫之基础库使用urllib 库urllib 包含4个模块,分别是request,error,parse,robotparserrequest:最基本的HTTP请求模块,模拟发送请求error:异常处理模块,捕获异常,后进行重试或其他操作parse:工具模块,提供许多URL处理方法robotparser:用于识别robots.txt文件,判断网站是否可以爬request ...
2020-03-29 00:23:30 711
原创 爬虫基础
爬虫基础HTTP 基本原理URI 和 URLURI : 统一资源标识符URL:统一资源定位符URI包含URL和URN,URN用得较少,几乎所有 URI 都是 URLHTTP 和 HTTPSURL 开头会有http或https...
2020-03-27 23:32:08 399
原创 Numpy 基础学习(一)
Numpy基础学习(一)数组的操作属性:确定数组大小、形状、存储大小、数据类型索引:获取和设置数组各元素的值切分:在大的数组中获取或设置更小的子数组变形:改变数组的形状拼接与分裂:将多个数组合并为一个,及将一个数组分裂为多个属性每个数组都有nidm(维度)、shape(每个维度的大小)、size(总大小)# 生成一个随机数组import numpy as npnp.r...
2020-03-26 10:01:29 111
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人