python
Noob_Zhou
这个作者很懒,什么都没留下…
展开
-
requests库入门学习
requests.request() 构造一个请求,支撑以下各方法的基础方法requests.get() 获取HTML网页的主要方法,对应于HTTP的GETrequests.head() 获取HTML网页头信息的方法,对应于HTTP的HEADrequests.post() 向HTML网页提交POST请求的方法,...原创 2018-03-15 16:59:25 · 252 阅读 · 0 评论 -
Python——Re库、match对象、Re库的贪婪匹配和最小匹配
Re库的主要功能函数一、search函数re.search(pattern,string,flags=0)flagssearch函数举例 match函数:findall函数:match对象 贪婪匹配和最小匹配:操作符后加 ?获得最小匹配结果...原创 2018-03-28 17:45:04 · 1076 阅读 · 0 评论 -
Python——正则表达式(regular expression RE)基本介绍
简洁表示表示特征一行胜千言表达无穷字符串组判断字符串的特征匹配表达文本类型的特征同时查找或替换一组字符串陪陪字符串的部分或全部主要使用在字符串的匹配正则表达式使用:编译:将符合正则表达式语法的字符串转换成正则表达式特征。 语法匹配IP地址的正则表达式Re库的使用是Python的标准库,主要用于字符串匹配调用 import re原生字符串类型 raw string与字符串类型区别前加r...原创 2018-03-28 17:12:12 · 444 阅读 · 0 评论 -
Python——Scrapy爬虫学习(1)——爬虫框架产生
演示地址:http://python123.io/ws/demo.html文件名称:demo.html产生爬虫框架:1、建立一个scrapy爬虫工程2、在工程中产生一个scrapy爬虫3、配置spider爬虫4、运行爬虫,获取网页具体操作:1、建立工程定义一个工程,名称为:python123demo方法:在cmd中,d: 进入d盘, cd pycodes 进入文件pycodes然后输入sc...原创 2018-03-30 10:58:49 · 727 阅读 · 0 评论 -
信息标记的三中形式
原创 2018-03-22 17:35:15 · 237 阅读 · 0 评论 -
Python——BeautifulSoup库(二)——基于bs4库的HTML内容遍历方法
标签树的下行遍历:可以用len()函数检索儿子节点的数量:len(soup.body.contents)用for in 遍历:标签树的上行遍历:标签树的平行遍历:平行遍历条件:同一个父亲 遍历: 总结:...原创 2018-03-22 17:19:35 · 1010 阅读 · 0 评论 -
Python——BeautifulSoup库入门
html相关内容: <p>..</p> : 标签Tag 例如:<p class = 'title'>...</p>理解:p为名称(Name),成对出现;class='title' 为属性(attributes),包含0或多个属性,由键 值 对构成。Beautiful Soup库也叫beautifulsoup4 或 bs4库。引用方式...原创 2018-03-22 16:44:00 · 272 阅读 · 0 评论 -
Python——Requests库——get\head\
原创 2018-03-15 20:32:58 · 418 阅读 · 0 评论 -
Python——Requests库主要方法解析——request函数
(一)request()方法**kwargs 13个控制访问参数params: 字节或字节序列,作为增加到url中的参数2.data3.json(http协议最经常使用的数据格式)4.head(可模拟任何我们想要模拟的浏览器向服务器发起访问)代表了向某url发起访问时的http的头字段定制协议头5.cookiesfiles 向链接提供文件https 使用代理服务器进行爬虫,隐藏用户原ip地址htt...原创 2018-03-15 20:29:11 · 4697 阅读 · 0 评论 -
Python——Requests库的方法(head() & post()
head()的方法r.headers反馈头部内容很少网络流量获得概要信息post()方法向服务器提交新增数据根据用户提供的数据的不同做相关的整理put()的方法原创 2018-03-15 20:07:54 · 12056 阅读 · 1 评论 -
HTTP协议
HTTP即Hyper text Transfor ProtocolURL格式 http://host[:port][path]host:合法的Internet主机域名或IP地址[:port]端口号,可省略,默认为80path 内部路径HTTP协议对资源的操作理解PATCH 与PUT的区别PUT方法会覆盖掉URL所对应的资源PATCH(补丁)只覆盖需要更改的地方(节省网络带宽)...原创 2018-03-15 19:51:54 · 157 阅读 · 0 评论 -
requests库入门学习(2)——requests库异常处理
response返回所有内容,同时提供一个方法用法举例涉及异常处理,用 try except语句用通用代码框架有效处理爬虫过程中遇到的错误或者网络不稳定导致的问题 def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() #如果状态不是200,引发HTTPError异常 r...原创 2018-03-15 17:21:19 · 1989 阅读 · 2 评论 -
Python学习笔记——global 全局变量的个人理解
今天在学习数据结构,学到了堆栈这一章中用列表实现堆栈这一部分,遇到了一个问题,先上代码MAXSTACK = 100# 为什么要全局变量定义stack?global stack# 创建栈空间stack = [None]*MAXSTACK# 堆栈顶端初始化top = -1# 判断是否为空栈:# *********注意,此函数返回值应该是True or Falsedef isE...原创 2019-09-12 13:55:54 · 430 阅读 · 0 评论