- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 正则表达式
正则表达式一、定义regular expression 用于检索、替换、匹配验证字符串。开源中国正则表达式测试工具:https://tool.oschina.net/regex一个URL:http://www.baidu.com正则表达式为[…]匹配一组字符串,[ab]匹配a,b,ab[a-zA-Z]匹配英文字母[^/s]匹配一组非空白字符串*匹配多个二、常用匹配规则字符...
2020-02-20 20:15:10 288
原创 记录一下最近找到的好玩的东西
记录一下最近找到的好玩的东西1 自定义各软件启动的快捷方式点击应用的快捷方式图标,右键,属性——快捷方式———快捷键2 将应用固定在任务栏上,Windows键加1则打开固定的第一个应用,以此类推。3 强制结束进程control shift esc 打开任务管理器性能--------打开资源监视器--------CPU---------关联的句柄搜索--------输入进程的名...
2020-02-18 10:32:38 279
原创 urllib.parse
解析链接文章目录解析链接一、简介 urllib.parse二、函数介绍1 urlparse()6(1)代码实例:(2)定义域值域定义域:参数:urlstring :scheme:allow_fragments:值域:(3)ParseResult中各属性的获取方法2 urlunparse()(1)代码实例:(2)定义域值域定义域:值域:3 urlsplit()54 urlunsplit()5 ur...
2020-02-16 16:11:55 753
原创 urllib异常处理URLError、HTTPError
urllib异常处理URLError、HTTPError文章目录urllib异常处理URLError、HTTPError一、异常处理二、URLError(1)来源(2)属性?(3)代码示例三、HTTPError(1)来源(2)属性?(3)代码示例一、异常处理urllib 的 error 模块定义了由 request 模块产生的异常。 如果出现了问题, request 模块便会抛州 error...
2020-02-16 11:15:50 1437
原创 将多个excel文件合并为一个excel中的多个sheet
1 将需要合并的多个excel文件放在同一个文件夹中,新建一个空的excel文件,将其放入该文件夹中2 打开新建的excel文件,all + f11 --------->插入-------模块3 粘贴代码'功能:把多个excel工作簿的第一个sh eet工作表合并到一个excel工作簿的多个sheet工作表,新工作表的名称等于原工作簿的名称Sub Books2Sheets()'...
2020-02-15 23:02:23 2031
原创 代理服务器
代理服务器文章目录代理服务器一 目的二 作用1.隐藏真实 IP2 提高访问速度:3 访问一些单位或团体内部资源:三 原理四 分类1 按协议分类FTP 代理服务器:HTTP 代理服务器:SSL 代理:RTSP 代理:Telnet代理:POP3/SMTP 代理:SOCKS 代理:2 按匿名程度分类高度匿名代理:普通匿名代理:透明代理:间谍代理:一 目的伪装自己的IP地址某些网站设置一些反爬虫措...
2020-02-13 14:49:16 688
原创 BeautifulSoup简介:day3
BeautifulSoup简介:文章目录BeautifulSoup简介:一、BeautifulSoup功能1解析原理2 编码方式3 其他解析器二、BeautifulSoup4四大对象种类1.Tag2、NavigableString3、BeautifulSoup4、Comment一、BeautifulSoup功能网页解析 , HTML/XML的解析器,主要的功能也是如何解析和提取 ...
2020-02-12 17:50:03 187
原创 网页基础(一)组成day2
网页基础(一) 组成文章目录网页基础(一) 组成一、HTML1作用2HTML 标签标签举例3 HTML 文档 = 网页二、CSS1 作用 定义了网页的结构“层叠”:“样式”2 CSS举例:3 使用方法: link标签三、JavaScript1 作用2.对比HTML CSS3 使用方法:script标签四、网页组成总结HTMLCSSJavaScript一、HTML1作用HTM...
2020-02-12 17:47:04 484
原创 爬虫构成
一、什么是爬虫爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。二、Python爬虫架构Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。**调度器相当于一台电脑的CPU,主要负责调度URL管理器、下载器、解析器之间的协调工作。URL管理器:包括待爬取的URL地址和已爬取的URL地址,防止...
2020-02-12 17:36:59 525
Linux运维文档网课习题.md
2020-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人