笔记
付学荷
这个作者很懒,什么都没留下…
展开
-
python---beautifulsoup4库及用法
beautifulsoup4库1.beautifulsoup4库概述beautifulsoup4库也称为bs4库或BeautifulSoup库 Python用于网页分析的第三方库,用来快速转换被抓取的网页。beautifulsoup4将网页转换为一颗DOM树。beautifulsoup4提供一些简单的方法以及类Python语法来查找、定位、修改一棵转换后的DOM树,还能自动将送进来的文档转换为Unicode编码。2. beautifulsoup4库的对象BeautifulSoup将HTML原创 2020-12-17 07:47:04 · 13632 阅读 · 0 评论 -
python---requests库的用法和案例
爬取网页的requests库1. requests库概述简洁的处理HTTP请求的第三方库,建立在Python的urllib3库基础上,是对urllib3库的再封装。requests库包括URL获取、HTTP长连接和连接缓存、自动内容解码、文件分块上传、连接超时处理、流数据下载等功能。2. requests库解析requests库的requests.get()方法功能是网络爬虫和信息提交res=requests.get(url[,timeout=n])该函数返回的网页内容会保存为一个res原创 2020-12-15 15:40:43 · 428 阅读 · 0 评论 -
python---urllib爬虫案例--爬取公众号文章中的图片
爬取公众号文章中的图片。第1步确定公众号文章的地址,以微信公众号“Python小屋”里的一篇文章为例,文章标题为“报告PPT(163页):基于Python语言的课程群建设探讨与实践”,地址为:https://mp.weixin.qq.com/s?__biz=MzI4MzM2MDgyMQ==&mid=2247486249&idx=1&sn=a37d079f541b194970428fb2fd7a1ed4&chksm=eb8aa073dcfd2965f2d48c5ae93原创 2020-12-14 23:50:41 · 452 阅读 · 0 评论 -
python---网络爬虫
1.爬虫简介网页爬取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 请求网站并提取数据的自动化程序2.爬取网页的基础知识-HTTP协议1.HTTP协议简介 超文本传输协议是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。 HTTP的发展是由蒂姆·伯纳斯-李于1989年在欧洲核子研究组织(CERN)所发起。1999年6月公布的 RFC2616,定义了HTTP协议中现今广泛使用的一个版本——HTTP 1.1。2014年12月,互联网工程任原创 2020-12-13 17:51:00 · 332 阅读 · 0 评论 -
python小案例
1.从键盘输入一个3位整数,计算并输出其百位、十位和个位上的数字,具体实现如例所示。x=input("请输入一个三位整数:")x=int(x)a=x//100b=x//10%10c=x%10print('百位:',a,'十位:',b,'个位:',c)程序运行时,从键盘输入356,则运行结果如图所示。2. 在上例中,通过使用//和%运算符可以获取一个3位整数百位、十位和个位上的数字。在后面学习map()函数后,还可以使用以下方法解决,具体如例所示。x=input("请输入一个三位整数:"原创 2020-12-12 17:11:31 · 740 阅读 · 0 评论 -
python正则表达式函数的用法
正则表达式的用法#导入模块 reimport re#所用的函数re.match() #match函数从头开始匹配,如果不是起始位置匹配成功的话,match函数的匹配结果就为none。re.search() #搜索整个字符串,并返回第一个成功的匹配re.findall() #搜索整个字符串,返回一个list(最常用的)re.compile() #compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象re.split() #将一个字符串按照正则原创 2020-12-10 16:01:23 · 214 阅读 · 0 评论 -
python文件处理
Python文件处理:创建、打开、追加、读、写1.如何创建文本文件使用Python,通过使用代码创建一个.文本文件(99.txt)第1步 f= open("guru99.txt","w+")我们声明变量f来打开一个名为textfile.txt的文件。OPEN采用两个参数,我们要打开的文件和表示我们想对文件执行的权限或操作类型的字符串。在这里,我们在参数中使用了“w”字母,它指示写和加号,这意味着如果库中不存在文件,它将创建一个文件。“w”旁边的可用选项是“r”表示读,“a”表示附加和加号,意原创 2020-12-03 09:10:44 · 73 阅读 · 0 评论