python
文章平均质量分 53
hazelnut_x
这个作者很懒,什么都没留下…
展开
-
打包 Python 文件为 exe 文件
安装 pyinstallerpip install pyinstaller执行命令进入程序目录,执行pyinstaller -F -w -i img.ico main.pypyinstaller main.spec-F 指只生成一个exe文件,不生成其他dll文件-w 不弹出命令行窗口-c 生成的exe文件打开方式为控制台打开。-i 设定程序图标第一条命令执行完这个命令之后,生成文件 main.spec。需要将除了新生成的build,dist以外的所有的文件或引用文件,复制到转载 2021-11-05 09:57:47 · 220 阅读 · 0 评论 -
【Python】 基于二分的查找和插入模块 bisect (示例+源码)
模块名bisect使用这个模块的函数前,需要先确保操作的列表是已排序的。查找函数返回如果执行插入操作,插入后内容在 list 中的位置,并不实际执行插入操作。bisect_left(list, item) :二分查找将 item 插入 list 时,插入位置的下标,如果 list 中存在 item 则返回最左侧 item 的下标。bisect_right(list, item) :二分查找将 item 插入 list 时,插入位置的下标,如果 list 中存在 item 则返回最右侧 it原创 2021-07-26 15:59:34 · 354 阅读 · 0 评论 -
MNIST 数据集下载 与 保存为图片格式
下载地址http://yann.lecun.com/exdb/mnist/文件说明文件名train-images.idx3-ubyte.gz:训练集图片(9912422字节),55000张训练集,5000张验证集train-labels.idx1-ubyte.gz:训练集图片对应的标签(28881字节),t10k-images.idx3-ubyte .gz:测试集图片(1648877字节),10000张图片t10k-labels.idx1-ubyte.gz:测试集图片对应的标签(4542字原创 2021-04-26 11:34:44 · 4368 阅读 · 7 评论 -
conda 中使用 pip 遇到的一些问题的解决方法
pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available解决:将路径 anaconda安装路径\Scripts 和 anaconda安装路径\Library\bin 添加到系统环境变量 path 中。Microsoft Visual C++ 14.0 is required在 此链接 根据系统位数选择相应版本进行下载,安装后重启电脑。...原创 2020-10-03 15:32:52 · 395 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【9 & 10】常见的反爬策略与反爬攻克手段、腾讯漫画爬取实战 与 分布式爬虫
文章目录爬虫常见的反爬策略与反爬攻克手段反爬策略与解决策略中国裁判文书网 爬取使用 PhantomJS爬取腾讯漫画分布式爬虫自己实现使用 Scrapy-redis 实现爬虫常见的反爬策略与反爬攻克手段反爬策略与解决策略反爬策略1:通过UA限制或者其他头信息限制解决方案:构建用户代理池(第2节糗百案例)或其他头信息反爬策略2:通过访问者IP限制解决方案:构建IP代理池反爬策略3:通过验证码限制解决方案:手工打码(第8节知乎案例)、验证码接口自动识别或者通过机器学习自动识别反爬策略4:原创 2020-09-16 11:50:14 · 691 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【6 - 8】:招聘信息、淘宝网商品信息 与 知乎 爬虫实战
文章目录招聘信息爬取淘宝网商品信息爬虫实战招聘信息爬取主要是爬取到的信息的解码:response = requests.get("https://search.51job.com/list/030200,000000,0000,00,9,99,python,2,0.html")data = bytes(response.text, response.encoding).decode("gbk", "ignore")由于网站原因,课程中代码已不再适用,可参考 《阿里云爬虫项目课程笔记【4】:Req原创 2020-09-15 18:49:29 · 264 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【5】:Scrapy 模块 与 当当爬虫实战
文章目录Scrapy 模块安装常用指令文件介绍流程例子当当爬虫实战Scrapy 模块安装使用 pip 或 在此 下载安装 wheel、lxml、twisted安装 pywin32配置 pywin32 :将 Python安装路径\Lib\site-packages\pywin32_system32 下的两个文件复制到 C:\Windows\System32常用指令指令功能scrapy startproject创建爬虫项目scrapy genspider -l原创 2020-09-15 18:44:13 · 340 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【4】:Requests 模块 与 云栖社区博文爬虫实战
文章目录Requests 模块发送接收例子云栖社区博文爬虫实战Requests 模块发送参数说明paramsget请求所用的参数headers添加头信息proxies添加代理cookiescookiedataput请求的数据接收参数内容text响应数据content响应数据(二进制类型)decoding网页编码cookies响应cookieurl当前请求的urlstatus_cod原创 2020-09-15 18:42:00 · 209 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【3】:腾讯视频评论实战
import urllib.requestimport re# 本页评论的 idcid = '6710538280024647270'for i in range(0, 10): url = "https://video.coral.qq.com/varticle/5885307195/comment/v2?callback=_varticle5885307195commentv2&orinum=10&oriorder=o&pageflag=1&curso原创 2020-09-14 21:06:36 · 227 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【2】:Urllib模块 与 糗事百科爬取实战
文章目录Urllib 模块糗事百科实战Urllib 模块import urllibimport urllib.request# 爬取到内存 忽略解码过程中错误data = urllib.request.urlopen("http://www.jd.com").read().decode('utf-8', 'ignore')# 验证数据爬取是否成功len(data)# 提取标题import repat = "<title>(.*?)</title>"titl原创 2020-09-14 20:59:44 · 230 阅读 · 0 评论 -
阿里云爬虫项目课程笔记【1】:正则表达式 与 XPath表达式
Python网络爬虫快速入门到精通课程地址文章目录正则表达式XPath 表达式正则表达式import rere.compile(正则表达式).findall(原始字符串)字符匹配普通字符正常匹配\n换行符\t制表符\w字母、数字、下划线\W非字母、数字、下划线\d十进制数字\D非十进制数字\s空白字符\S非空白字符[abc123]原子表,abc123中的任意一个[^abc123]原子表,.原创 2020-09-14 15:58:56 · 232 阅读 · 0 评论 -
Python 虚拟环境: virtualenv 安装与使用
文章目录安装1.安装virtualenv2.创建虚拟运行环境目录3.创建运行环境使用进入环境安装第三方包运行程序退出环境删除环境安装1.安装virtualenvpip3 install virtualenv 2.创建虚拟运行环境目录mkdir pyenvcd pyenv3.创建运行环境virtualenv --no-site-packages --python=python3 ...原创 2020-04-08 14:36:08 · 184 阅读 · 0 评论 -
matplotlib.pyplot的plt中文显示异常的解决方法
解决方法import matplotlib.pyplot as plt# 导入之后加入下面这句plt.rcParams['font.sans-serif'] = ['Microsoft Yahei']其中字体可选的包括:微软雅黑 'Microsoft Yahei' 微软正黑体 'Microsoft JhengHei' 黑体 'SeiHei' 楷体 'KaiTi' 仿宋 'FangSong' 新宋体 'NsimSun' 测试.原创 2020-09-08 17:42:19 · 1271 阅读 · 1 评论