python_hazelnut_x的博客-CSDN博客

python

关注

文章平均质量分 53

关注数：文章数：13 文章阅读量：8985 文章收藏量：26

作者: hazelnut_x

这个作者很懒，什么都没留下…

展开

打包 Python 文件为 exe 文件

安装 pyinstallerpip install pyinstaller执行命令进入程序目录，执行pyinstaller -F -w -i img.ico main.pypyinstaller main.spec-F 指只生成一个exe文件，不生成其他dll文件-w 不弹出命令行窗口-c 生成的exe文件打开方式为控制台打开。-i 设定程序图标第一条命令执行完这个命令之后，生成文件 main.spec。需要将除了新生成的build，dist以外的所有的文件或引用文件，复制到

转载 2021-11-05 09:57:47 · 220 阅读 · 0 评论
【Python】基于二分的查找和插入模块 bisect (示例+源码)

模块名bisect使用这个模块的函数前，需要先确保操作的列表是已排序的。查找函数返回如果执行插入操作，插入后内容在 list 中的位置，并不实际执行插入操作。bisect_left(list, item) ：二分查找将 item 插入 list 时，插入位置的下标，如果 list 中存在 item 则返回最左侧 item 的下标。bisect_right(list, item) ：二分查找将 item 插入 list 时，插入位置的下标，如果 list 中存在 item 则返回最右侧 it

原创 2021-07-26 15:59:34 · 354 阅读 · 0 评论
MNIST 数据集下载与保存为图片格式

下载地址http://yann.lecun.com/exdb/mnist/文件说明文件名train-images.idx3-ubyte.gz：训练集图片（9912422字节），55000张训练集，5000张验证集train-labels.idx1-ubyte.gz：训练集图片对应的标签（28881字节），t10k-images.idx3-ubyte .gz：测试集图片（1648877字节），10000张图片t10k-labels.idx1-ubyte.gz：测试集图片对应的标签（4542字

原创 2021-04-26 11:34:44 · 4368 阅读 · 7 评论
conda 中使用 pip 遇到的一些问题的解决方法

pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available解决：将路径 anaconda安装路径\Scripts 和 anaconda安装路径\Library\bin 添加到系统环境变量 path 中。Microsoft Visual C++ 14.0 is required在此链接根据系统位数选择相应版本进行下载，安装后重启电脑。...

原创 2020-10-03 15:32:52 · 395 阅读 · 0 评论
阿里云爬虫项目课程笔记【9 & 10】常见的反爬策略与反爬攻克手段、腾讯漫画爬取实战与分布式爬虫

文章目录爬虫常见的反爬策略与反爬攻克手段反爬策略与解决策略中国裁判文书网爬取使用 PhantomJS爬取腾讯漫画分布式爬虫自己实现使用 Scrapy-redis 实现爬虫常见的反爬策略与反爬攻克手段反爬策略与解决策略反爬策略1：通过UA限制或者其他头信息限制解决方案：构建用户代理池（第2节糗百案例）或其他头信息反爬策略2：通过访问者IP限制解决方案：构建IP代理池反爬策略3：通过验证码限制解决方案：手工打码（第8节知乎案例）、验证码接口自动识别或者通过机器学习自动识别反爬策略4：

原创 2020-09-16 11:50:14 · 691 阅读 · 0 评论
阿里云爬虫项目课程笔记【6 - 8】：招聘信息、淘宝网商品信息与知乎爬虫实战

文章目录招聘信息爬取淘宝网商品信息爬虫实战招聘信息爬取主要是爬取到的信息的解码：response = requests.get("https://search.51job.com/list/030200,000000,0000,00,9,99,python,2,0.html")data = bytes(response.text, response.encoding).decode("gbk", "ignore")由于网站原因，课程中代码已不再适用，可参考《阿里云爬虫项目课程笔记【4】：Req

原创 2020-09-15 18:49:29 · 264 阅读 · 0 评论
阿里云爬虫项目课程笔记【5】：Scrapy 模块与当当爬虫实战

文章目录Scrapy 模块安装常用指令文件介绍流程例子当当爬虫实战Scrapy 模块安装使用 pip 或在此下载安装 wheel、lxml、twisted安装 pywin32配置 pywin32 ：将 Python安装路径\Lib\site-packages\pywin32_system32 下的两个文件复制到 C:\Windows\System32常用指令指令功能scrapy startproject创建爬虫项目scrapy genspider -l

原创 2020-09-15 18:44:13 · 340 阅读 · 0 评论
阿里云爬虫项目课程笔记【4】：Requests 模块与云栖社区博文爬虫实战

文章目录Requests 模块发送接收例子云栖社区博文爬虫实战Requests 模块发送参数说明paramsget请求所用的参数headers添加头信息proxies添加代理cookiescookiedataput请求的数据接收参数内容text响应数据content响应数据（二进制类型）decoding网页编码cookies响应cookieurl当前请求的urlstatus_cod

原创 2020-09-15 18:42:00 · 209 阅读 · 0 评论
阿里云爬虫项目课程笔记【3】：腾讯视频评论实战

import urllib.requestimport re# 本页评论的 idcid = '6710538280024647270'for i in range(0, 10): url = "https://video.coral.qq.com/varticle/5885307195/comment/v2?callback=_varticle5885307195commentv2&orinum=10&oriorder=o&pageflag=1&curso

原创 2020-09-14 21:06:36 · 227 阅读 · 0 评论
阿里云爬虫项目课程笔记【2】：Urllib模块与糗事百科爬取实战

文章目录Urllib 模块糗事百科实战Urllib 模块import urllibimport urllib.request# 爬取到内存忽略解码过程中错误data = urllib.request.urlopen("http://www.jd.com").read().decode('utf-8', 'ignore')# 验证数据爬取是否成功len(data)# 提取标题import repat = "<title>(.*?)</title>"titl

原创 2020-09-14 20:59:44 · 230 阅读 · 0 评论
阿里云爬虫项目课程笔记【1】：正则表达式与 XPath表达式

Python网络爬虫快速入门到精通课程地址文章目录正则表达式XPath 表达式正则表达式import rere.compile(正则表达式).findall(原始字符串)字符匹配普通字符正常匹配\n换行符\t制表符\w字母、数字、下划线\W非字母、数字、下划线\d十进制数字\D非十进制数字\s空白字符\S非空白字符[abc123]原子表，abc123中的任意一个[^abc123]原子表，.

原创 2020-09-14 15:58:56 · 232 阅读 · 0 评论
Python 虚拟环境： virtualenv 安装与使用

文章目录安装1.安装virtualenv2.创建虚拟运行环境目录3.创建运行环境使用进入环境安装第三方包运行程序退出环境删除环境安装1.安装virtualenvpip3 install virtualenv 2.创建虚拟运行环境目录mkdir pyenvcd pyenv3.创建运行环境virtualenv --no-site-packages --python=python3 ...

原创 2020-04-08 14:36:08 · 184 阅读 · 0 评论
matplotlib.pyplot的plt中文显示异常的解决方法

解决方法import matplotlib.pyplot as plt# 导入之后加入下面这句plt.rcParams['font.sans-serif'] = ['Microsoft Yahei']其中字体可选的包括：微软雅黑 'Microsoft Yahei' 微软正黑体 'Microsoft JhengHei' 黑体 'SeiHei' 楷体 'KaiTi' 仿宋 'FangSong' 新宋体 'NsimSun' 测试.

原创 2020-09-08 17:42:19 · 1271 阅读 · 1 评论

python

作者: hazelnut_x

打包 Python 文件为 exe 文件

【Python】 基于二分的查找和插入模块 bisect (示例+源码)

MNIST 数据集下载 与 保存为图片格式

conda 中使用 pip 遇到的一些问题的解决方法

阿里云爬虫项目课程笔记【9 & 10】常见的反爬策略与反爬攻克手段、腾讯漫画爬取实战 与 分布式爬虫

阿里云爬虫项目课程笔记【6 - 8】：招聘信息、淘宝网商品信息 与 知乎 爬虫实战

阿里云爬虫项目课程笔记【5】：Scrapy 模块 与 当当爬虫实战

阿里云爬虫项目课程笔记【4】：Requests 模块 与 云栖社区博文爬虫实战

阿里云爬虫项目课程笔记【3】：腾讯视频评论实战

阿里云爬虫项目课程笔记【2】：Urllib模块 与 糗事百科爬取实战

阿里云爬虫项目课程笔记【1】：正则表达式 与 XPath表达式

Python 虚拟环境： virtualenv 安装与使用

matplotlib.pyplot的plt中文显示异常的解决方法

【Python】基于二分的查找和插入模块 bisect (示例+源码)

MNIST 数据集下载与保存为图片格式

阿里云爬虫项目课程笔记【9 & 10】常见的反爬策略与反爬攻克手段、腾讯漫画爬取实战与分布式爬虫

阿里云爬虫项目课程笔记【6 - 8】：招聘信息、淘宝网商品信息与知乎爬虫实战

阿里云爬虫项目课程笔记【5】：Scrapy 模块与当当爬虫实战

阿里云爬虫项目课程笔记【4】：Requests 模块与云栖社区博文爬虫实战

阿里云爬虫项目课程笔记【2】：Urllib模块与糗事百科爬取实战

阿里云爬虫项目课程笔记【1】：正则表达式与 XPath表达式