![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 91
okboy519
这个作者很懒,什么都没留下…
展开
-
猫眼数据爬取
import jsonimport reimport requestsfrom requests.exceptions import RequestException# 伪造:UserAgent,某些网站会识别python爬虫程序并阻断,通过构造User_Agent可以抵抗某些反爬虫机制from fake_useragent import UserAgentfrom multiprocessing import Poolua = UserAgent()# 获取数据def get_on原创 2020-08-01 17:31:18 · 491 阅读 · 0 评论 -
py3爬虫--beautiful-soup库的使用
Beautiful soup灵活又方便的网页解析库,处理高效,支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取安装pip install beautifulsoup4引入import bs4 from解析库解析器使用方法优势劣势Python标准库BeautifulSoup(markup,"html.parser")Python的内置标准库执行速度适中文档容错能力强Python 2.7.3 or 3.2.2)前 的版本中文档容错能力差原创 2020-08-01 14:49:47 · 192 阅读 · 0 评论 -
python3爬虫笔记
什么是爬虫?**请求网站并提取**数据的 **自动化**程序爬虫的基本流程发起请求通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应获取响应内容如果服务器能正常响应,会得到一个Response,Response的内容便是索要获取的页面内容,类型可能有HTML,JSON字符串,二进制数据(如图片视频)等类型。解析文本内容得到的内容可能是HTML,可以用正则表达式、网页解析库进行解析。可能是JSON,可以直接转为JS原创 2020-08-01 13:18:06 · 117 阅读 · 0 评论 -
python3----元组(tuple)笔记
元组元组与列表的区别列表的数据可以修改元组内的数据是不能修改的定义元组元组特点:定义元组使⽤⼩括号,且逗号隔开各个数据,数据可以是不同的数据类型。# 多个数据元组t1 = (10,20,30)# 单个数据元组t2 = (10,)注意:如果定义的元组只有⼀个数据,那么这个数据后⾯也好添加逗号,否则数据类型为唯⼀的这个数据的数据类型t2 = (10,)print(type(t2)) # tuplet3 = (20)print(type(t3)) # intt4 = ('he原创 2020-06-28 11:41:57 · 126 阅读 · 0 评论 -
python3--列表笔记
3列表列表的应用场景列表格式列表的常用操作列表的遍历循环列表的嵌套使用1.列表的应用场景列表一次性可以存储多个数据,跟js的数组类似2.列表格式[数据1,数据2,数据3,数据4,…]列表可以y一次性存储多个数据,且可以为不同数据类型。工作中需要存储相同类型,好维护3.列表的常用操作3.1查找3.1.1下标查找name_list = ['tom','lulu','jack']print(name_list[0])#tomprint(name_list[1])#lulu原创 2020-06-28 11:26:16 · 117 阅读 · 0 评论 -
python3字符串笔记
字符串认识字符串字符串是py中最常用的数据类型,一般使用引号创建。a = 'hello,world'字符串特征单引号字符串 a = 'tom'双引号字符串 a = "tony"三引号字符串 三引号可以回车换行显示字符串输出print('hello,world')name = 'tom'print('我的名字是%s' %name)#我的名字是tomprint(f'我的名字是{name}')# 我的名字是tom字符串输入在py中,用input()接受用户的输入,返回的是字符原创 2020-06-27 22:31:20 · 182 阅读 · 0 评论 -
python3格式化输出
%s格式话字符串。%d,%f name = 'tom' age = 15 weight = 72.3 stu_id = 1 print('我是%s,我今年%d岁了,我的体重是%.2f公斤,我的学号是%06d' % (name, age, weight,stu_id)) #我是tom,我今年15岁了,我的体重是72.30公斤,我的学号是000001%06d,表示输出的整数显示位数,不足以0不全,超出当前位数则原样输出%.2f,表示小数点后显示的小数位数。f格式化字符串 f’{表达式}’原创 2020-06-24 09:16:11 · 1483 阅读 · 0 评论