Python
文章平均质量分 72
Python
拿泥more
部分内容是从我的语雀知识库迁移过来的
展开
-
B站UP视频按频道下载、按分类下载、收藏夹下载、一键全部下载
批量下载B站视频原创 2024-09-03 11:39:40 · 475 阅读 · 0 评论 -
使用requests做爬虫
requests库的session会话对象可以跨请求保持某些参数,说白了,就是比如你使用session成功的登录了某个网站,则在再次使用该session对象求求该网站的其他网页都会默认使用该session之前使用的cookie等参数。在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。表示整个正则表达式匹配到的内容,表示捕获组匹配到的内容(其中,n>=1)subn返回的结果是一个元组(替换后的字符串,替换次数)。json.load()函数的使用,将读取json信息。原创 2024-09-02 11:26:14 · 2036 阅读 · 0 评论 -
pandas基础操作
参考:https://www.gairuo.com/p/pandas-selecting-data。df.iloc 与 df.loc 相似,但只能用自然索引。iat 和 iloc 一样,仅支持数字索引。转载 2024-09-02 11:25:10 · 94 阅读 · 0 评论 -
Python刷算法题必备技巧总结
检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,该方法与 python find()方法一样,只不过如果str不在 string中会报一个异常。filter()方法返回一个新的列表List,不改变原始列表,能够有效的去除List中False,0,None,空字符串等所有等于False的元素。help()函数是查看函数或模块用途的详细说明,而dir()函数是查看函数或模块内的操作方法都有什么,输出的是方法列表。原创 2024-09-02 11:08:31 · 1099 阅读 · 0 评论 -
selenium模块 快速上手
selenium 模块selenium中文文档https://python-selenium-zh.readthedocs.io/zh_CN/latest/快速上手示例1:#爬取全历史一个页面的画作名字from selenium import webdriverfrom time import sleepfrom lxml import etree# 实例化对象 PS:需要先下载浏览器驱动http://chromedriver.storage.googleapis.com/ind原创 2020-11-27 14:32:00 · 327 阅读 · 1 评论 -
开始你的第一个爬虫程序
爬虫基础爬虫:模拟浏览器上网,抓取数据。www.baidu.com/robots.txt常用请求头User-AgentConnection:请求完毕后,是断开还是保持连接常用响应头Content-Type:服务器响应回客户端的数据类型https安全的超文本传输协议加密方式:对称密钥加密非对称密钥加密证书密钥加密requests使用:确定url发送请求获取响应数据存储get方法requests.get(url原创 2020-10-24 17:57:09 · 289 阅读 · 2 评论 -
解决Python pip 安装第三方库问题
下载问题出现下载慢的问题使用国内源http://mirrors.aliyun.com/pypi/simplehttp://pypi.douban.com/simplehttps://pypi.tuna.tsinghua.edu.cn/simplepython -m pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple # 安装lxml库提示没有管理员权限无法安装问题python -m pip insta原创 2020-09-28 22:07:08 · 873 阅读 · 0 评论 -
Python进制转换
dec = int(input("输入数字:"))print("十进制数为:", dec)print("转换为二进制为:", bin(dec))print("转换为八进制为:", oct(dec))print("转换为十六进制为:", hex(dec))...原创 2020-01-11 21:06:26 · 515 阅读 · 0 评论