自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Mac安装pyaudio报错的解决方案

看见这个提示没有直接复制以下内容,粘贴到终端,配置环境(echo;(echo;(echo;

2023-04-01 15:36:37 2555

原创 解决 ValueError: check_hostname requires server_hostname

今天使用mitmproxy抓包工具对小程序进行抓包,遇到一个问题:在开着mitmdump监听代理时,使用requests库对监听到的url进行请求会报错,错误类型如标题。百度了两个小时,把百度结果前三页的所有让降版本的文章里的版本挨个试了一遍,包括还有一个让配置环境变量的,都试了,还是没有改变结果。后经提点,改用urllib3对url进行访问,成功获取到了结果import urllib3def request(flow): if 'https://www.xiaohongshu.com/f

2021-08-14 17:55:48 708

原创 python爬虫----selenium实战(爬取腾讯招聘)

声明 : 本篇仅学习使用,不到将其用于其他途径.import time,pymongo#先导入驱动,我这边用的谷歌的from selenium import webdriver#显式延时等待from selenium.webdriver.support.wait import WebDriverWait#对网页上元素是否存在,可点击等等进行判断,一般用于断言或与WebDriverWait配合使用from selenium.webdriver.support import expected_co

2021-08-06 14:48:21 483

原创 python爬虫——Beautiful Soup库

Beautiful Soup,当前为4.4.0版本,简称 bs4,bs4不属于python标准库,需安装:pip install bs4官方中文文档:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/简单来说,BeautifulSoup 就是 Python 的一个 HTML 或 XML 的解析库,我们可以用它来方便地从网页中提取数据。bs4 最大的特点是简单易用,不像正则和 xPath 需要刻意去记住很多特定语法,尽管那样会效率更高更直接。bs4 自

2021-07-29 00:43:45 353

原创 python爬虫——xpath

XPath非python标准库,是lxml库里的一个支持模块,需安装:pip install lxmllxml python 官方文档:http://lxml.de/index.htmlXPath,全称 XML Path Language,即 XML 路径语言,它是一门在 XML 文档中查找信息的语言。最初是用来搜寻 XML 文档的,但同样适用于 HTML 文档的搜索.XPath的功能非常强大,几乎所有想要定位的节点都可以用 XPath 来选择。官方文档:https://www.w3.org/TR/

2021-07-29 00:35:23 585

原创 python爬虫——Pyquery库

Pyquery库并非python标准库,所以需要下载:pip install pyqueryPyquery是一个类似jquery(一个js库)的库,使用 lxml 进行快速 xml 和 html 操作。利用它,我们可以直接解析 DOM 节点的结构,并通过 DOM 节点的一些属性快速进行内容提取。1. 初始化Pyquery对象初始化pyquery对象的方法有三种:文件名(filename)、网址(url)、字符串(text)1.1 通过网址(url)初始化Pyquery对象即,解析网址。在发起请求

2021-07-27 23:52:04 828

原创 python办公自动化——os模块批量修改文件名

今天工作中遇到了这个问题,就复习了下相关内容。这个问题实际上是考验基础知识扎不扎实。import ospath = r'E:\\桌面\\主数据模板\\'ls1 = os.listdir(path)for i in ls1: if os.path.isfile( path+ i): new = i.replace('弦乐', '吉他') old_name = path + i new_name = path + new os

2021-07-27 15:20:47 190

原创 python—正则表达式

python—正则表达式官方中文文档:https://docs.python.org/zh-cn/3/library/re.html#search-vs-match正则语法表以下为常用语法,部分不常用语法(先行断言(lookahead)和后行断言(lookbehind) )见补充:https://www.runoob.com/w3cnote/reg-lookahead-lookbehind.html范例所用文本:"""<link rel="dns-prefetch" href="/

2021-07-27 00:06:54 201 1

转载 linux常用命令

常用指令ls   显示文件或目录 -l 列出文件详细信息l(list) -a 列出当前目录下所有文件及目录,包括隐藏的a(all)mkdir 创建目录 -p 创建目录,若无父目录,则创建p(parent)cd 切换目录touch 创建空文件echo 创建带有内容的文件。cat 查看文件内容cp

2021-03-30 22:16:02 59

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除