- 博客(12)
- 收藏
- 关注
原创 2021-01-01
一、Python网络爬虫 1.爬虫简介 网页爬取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 请求网站并提取数据的自动化程序 2.爬取网页的基础知识-HTTP协议 ① HTTP协议简介 超文本传输协议是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。 HTTP的发展是由蒂姆·伯纳斯-李于1989年在欧洲核子研究组织(CERN)所发起。1999年6月公布的 RFC 2616,定义了HTTP协议中现今广泛使用的一个版本——HTTP 1.1。 2014年
2021-01-01 17:10:38 113
原创 2020-12-29
一、Python正则表达式 1 简介 正则表达式是字符串处理的有力工具,比字符串自身提供的方法提供了更强大的处理功能。 例如判断一个字符串是否是合法的Email地址,可以通过构造一个规则(正则表达式),去判断字符串是否能够匹配。 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。 正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。 在很多文本编辑器里
2020-12-29 13:41:05 156
原创 2020-12-27
基本语法1. 注释注释即对程序代码的解释,在写程序时需适当使用注释,以方便自己和他人理解程序各部分的作用。在执行时,它会被Python解释器忽略,因此不会影响程序的执行。Python支持单行注释与多行注释。 单行注释该注释是以“#”开始,到该行末尾结束。多行注释该注释以3个引号作为开始和结束符号,其中3个引号可以是3个单引号或3个双引号。2 标识符与关键字现实世界中每种事物都有自己的名称,从而与其他事物区分开。例如,生活中每种交通工具都有一个用来标识的名称。在Python语言中,同样也需要对程序中各个元素命
2020-12-27 15:21:55 175
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人