ALL程序猿-CSDN博客

原创 python图片验证码识别-基于机器学习的muggle_ocr图片验证码识别

开源项目muggle-orc 感谢原作者的辛苦创作感谢阿J大佬的分享（白嫖）这是一个为麻瓜设计的本地OCR模块只需要简单几步操作即可拥有两大通用识别模块，让你在工作中畅通无阻。这个将0识别为o了，这边将源码中的字符列表等全换为数字列表，识别单数字验证码准确率会高很多。SDK类参数参数名必选类型说明model_typeNoModelType指定预置模型类型conf_pathNostr指定自定义模型yaml配置文件（绝对路径）以上参数两者.

2021-05-28 09:28:41 1197 2

原创 Python喜马拉雅有声小说音频文件爬虫

今天爬取的是喜马拉雅有声小说。目标网址：https://www.ximalaya.com/youshengshu/分析操作开始：首先在喜马拉雅有声小说页面，播放任意音频。当播放音频时，打开抓包工具（加载网页后打开抓包工具，发现没有抓到数据包，刷新网页就行），这边选择媒体Media，一般的视频，音频文件都会在这里被抓取到。下图就是抓到的音频文件。我们尝试访问一下该接口的url，将url复制到浏览器打开。发起访问后，跳转出了一个保存文件到本地的界面。我们选择保存，发现多了一个类型

2021-03-18 09:23:42 15814 21

原创 Python爬虫案例，腾讯动漫爬虫，步骤超详细解释。

实施步骤(1) 数据爬取：使用requests请求为基础获取数据源。(2) UA伪装：模拟浏览器访问网址。(3) 数据解析：使用xpath语法处理数据。(4) 数据存储：获取需求数据后使用Excrl进行存储目标网址https://ac.qq.com/Comic/all/search/hot/page/1库的使用Openpyxl：openpyxl 模块是一个读写 Excel 2010 文档的 Python 库，如果要处理更早格式的 Excel 文档，需要用到其它库（如：xlrd、xlwt 等）

2020-12-28 10:41:51 5038 6

原创爬虫模板！request基础模块------＞＞模板

01request.测试import requestsclass RequestSpider(object): def __init__(self): url = "https://www.baidu.com/" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrom

2020-11-27 11:38:58 1901 1

原创有道翻译js逆向

有道翻译两个加密，一个是sign用了MD5加密，另一个是返回值AES加密，AES的密匙还用md5加密了一下。先看看第一个含有sign的，打个断点发现返回值29a…明显不对，第二个点击发现跟第一个是一样的。k函数的作用就是组成一个除了时间戳不一样，其他都一样的字符串。首先还是sign那里打断点，然后运行，追踪。再点击第三个搜索结果，看看第三个含有sign的，打个断点测试一下。digest(‘hex’)的意思就是返回16进制的值。很明显这个K函数返回的就是我们需要的sign。最后返回的就是sign的值。

2024-04-15 16:49:06 421

原创 Python装饰器教学

在Python中，装饰器是一种高级语法特性，允许你修改或增强函数、方法或类的行为，而无需修改其源代码。装饰器本质上是一个接受函数作为参数的函数，并返回一个新的函数对象。日志记录是装饰器的一个非常实用的应用场景。装饰器用于保留原始函数的元信息，这样在日志中就可以正确地显示函数名。这样，我们就可以通过传递不同的参数来创建具有不同行为的装饰器。的装饰器，它接受一个函数作为参数，并返回一个新的函数。语法，我们可以将装饰器应用到任何函数上，如。是一个返回装饰器的函数。是一个装饰器函数，它接受一个函数。

2024-03-26 17:22:41 647 1

原创 * 和 **

在实际开发中，类似的技巧可以用于创建中间件、插件系统、事件处理器等需要高度灵活性和可扩展性的场景。用户可以传递他们需要的任何参数，而你的代码只需要关心处理这些参数的核心逻辑。：在复杂的函数调用链中，一个函数可能需要将接收到的参数原封不动地传递给另一个函数。编写的函数更容易适应这些变化，因为它们可以接受新类型的参数而无需修改函数签名。，它包含了要传递给函数的前三个位置参数的值。来构建一个灵活的函数装饰器，该装饰器可以用于记录函数调用的信息。的灵活性，使得它可以无需修改就能用于具有不同参数签名的多个函数。

2024-03-26 17:21:51 591

原创 Python项目管理利器poetry我愿称之为神！

在当前的工作目录中初始化一个新的poetry项目非常简单，只需要在命令行中运行poetry new project_name，这将创建一个新的项目目录并生成初始的项目文件。在管理完依赖项后，通过运行 poetry install 命令，poetry 将会按照 pyproject.toml 文件中定义的依赖关系，安装所有项目所需的依赖项。在上述示例中，poetry 会在项目的虚拟环境中执行 main.py 文件，并自动使用项目定义的依赖项。这样，使用 poetry，我们能够轻松地管理项目的打包和发布流程。

2023-12-02 12:44:30 288 3

原创 java算数运算符-笔记

java基础

2022-05-31 22:44:11 334

原创 jupyter notebook报错500 : Internal Server Error

jupyter notebook报错500 : Internal Server Errorpip install --upgrade --user nbconvert

2021-06-17 21:44:13 1169 4

原创 Python抽帧生成手绘风视频

主要分为三部分，抽帧，每帧转手绘风，再将所有照片拼接成视频。主要是第二部，大家可以尽情发挥转字符串画之类的都可以。冲！第一部分视频抽帧import osimport cv2def extract_frames(video_path, dst_folder, index, frame_num): video = cv2.VideoCapture() if not video.open(video_path): print("can not open the vid

2021-04-24 09:27:42 422 1

原创毛豆汽车数据爬虫--附源码

毛豆汽车数据爬虫–附源码没啥教程就是简单的爬虫加个正则有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:毛豆# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 14:22import requestsfrom fake_useragent import UserAgentimport reimport csvheaders =

2021-04-07 21:33:18 237

原创链家爬虫获取链家网页数据-附带源码

链家爬虫没啥教程就是简单的爬虫加个正则有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:链家# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 10:19import requests, refrom fake_useragent import UserAgentimport timeimport csvheaders =

2021-04-07 18:13:40 877 1

原创 python安装telegram.ext No matching distribution found for ‘telegram.ext’

python安装telegram.extpip install python-telegram-bot

2021-03-24 19:50:16 1240

原创 No module named ‘alipay‘

No module named ‘alipay’解决办法pip install python_alipay_sdk

2021-03-08 09:42:56 2247

原创 No module named ‘pywin32_bootstrap‘

No module named ‘pywin32_bootstrap’解决方法！！pip install --ignore-installed pywin32==225

2021-03-08 09:40:35 649

原创 JD京东爬虫-商品评论爬虫-----附源码

JD京东爬虫-商品评论爬虫附源码本教程适合初学者。分析开始---------------打开京东商品链接，打开抓包工具（加载网页后打开抓包工具，发现没有抓到数据包，刷新网页就行），这边直接筛选js了，就不用看那么多内容。然后在响应数据中看看有没有想要的评论数据。然后双击抓到的数据包，或者复制url进入浏览器。打开后发现是json数据，看到这里是不是头皮发麻，哈哈哈，不要慌！管它呢么多，咱们要的是文字的评论数据，直接使用正则就好了。有时不得不说，正则真的是很好用的。但是细心地同志会

2021-03-08 08:51:15 11554 32

原创 python实现投票问题。

新学年开始﹐小羊所在的班级要重新选举新一届的班长。为保证公平公正,选举采用无记名投票的方式,每名同学依次在选票上写上自己支持的候选人姓名。通过唱票﹐得票最高的候选人当选为新一届的班长。(题目数据保证仅有一人获得最高票)。count = int(input())all_name_tic = {}for i in range(count): name = input() if name not in all_name_tic: all_name_tic[name] =

2021-01-08 11:04:18 5459

原创 python实现周末舞会问题

假设在周末舞会上，男士们和女士们进入舞厅时，各自排成一队。跳舞开始时，依次从男队和女队的队头上各出一人配成舞伴。规定每个舞曲能有一对跳舞者。若两队初始人数不相同，则较长的那一队中未配对者等待下一轮舞曲。现要求写一个程序，模拟上述舞伴配对问题。n,m =map(int,input().split())k = int(input())man = list(range(1,n + 1))woman = list(range(1, m + 1))while True: if len(man) =

2021-01-08 11:02:18 1693

原创群友专享

爬虫技术交流链接：https://pan.baidu.com/s/1OQWrQiLgFouulz0Uv1o9ww提取码：2sn2复制这段内容后打开百度网盘手机App，操作更方便哦–来自百度网盘超级会员V2的分享

2021-01-07 17:13:32 344

原创京东抢茅台脚本python

原作者链接https://github.com/huanghyw/jd_seckill/tree/master部署好了，哈哈哈谢谢作者开源！

2021-01-05 14:56:07 2054 1

原创 IP接口每10分钟自动获取

# -*- endoding: utf-8 -*-# @ModuleName:淘宝客户py# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/1/3 2:20import requestsimport timeurls = ['http://www.*********************', 'http://gev.qydai********', 'http://api.66daili.cn/API/GetSe

2021-01-04 08:17:33 764

原创豆瓣爬虫详情页保存成Excel

需求爬取豆瓣电影详情页详细数据。排名链接电影名主演评分评价人数年份类型制片国家/地区导演语言上映日期片长简介源码如下：import requests, json, openpyxlfrom lxml import etreewb = openpyxl.Workbook()sheet = wb.activesheet_name = ['排名', '链接', '电影名', '主演',

2021-01-04 08:03:43 893 2

原创异或加密并暴力破解测试破解密码可行性

key = key * (len(plaintext) // len(key)) + key[:len(plaintext) % len(key)]#取整数/余数 ciphertext=[] for i in range(len(plaintext)): ciphertext.append(str(ord(plaintext[i])^ord(key[i]))) key = ','.join(ciphertext)密码枚举测试...

2021-01-04 07:59:04 1866 1

原创 WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne

“ WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne”报错pip install xxx -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

2020-12-29 20:58:00 316

原创 RuntimeError: ‘cryptography‘ package is required for sha256_password or caching_sha2_password auth m

RuntimeError: ‘cryptography’ package is required for sha256_password or caching_sha2_password auth methods报错启动Django时报错解决方法：pip install cryptography

2020-12-24 10:58:53 656

原创 Django框架创建入门流程

DjangoSQLite轻量级的嵌入式级的数据库特点是小常用场景Android IOS WP数据库常规操作相似度和MySQL达百分之九十五快捷键万能键-alt + 回车实现一个请求注册一个路由urls中url参数① 匹配规则正则视图函数对应的是views中的一个函数没有括号去views实现对应的视图函数第一个参数是request永远记得返回Responsehtml快捷键ul>liul*5

2020-12-09 20:44:11 155 1

原创 tkinter模块实现贪吃蛇小游戏项目实战

# -*- endoding: utf-8 -*-# @ModuleName:贪吃蛇# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2020/11/30 21:57import timefrom tkinter import *import randomaaaa = []# basic game configurationdef clicked(event): passdef growSnake(): global sc

2020-12-07 11:42:17 711

原创 UnicodeEncodeError: ‘gbk‘ codec can‘t encode character解决办法

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\ue615’ in position 488084: illegal multibyte sequence 解决办法with open('baidu.html', 'w', encoding='utf-8') as f: f.write(data)

2020-11-25 20:00:55 2139 1

原创 Scrapy爬虫框架模板及笔记。

import scrapy # 导入scrapy# 创建爬虫类并且继承自scrapy.Spider --> 最基础的类另外几个各类都是继承自这个类class ProxySpider(scrapy.Spider): name = 'proxy' # 爬虫名字--> 必须唯一 allowed_domains = ['cn-proxy.com'] # 允许采集的域名 start_urls = [f'http://cn-proxy.com/{page}' f

2020-11-17 09:11:17 2969

原创使用Base64包加密和解密 ----Python

a 为一个加密的字符串c 为需要加密的字符串import base64a = "MjAyMDExMTMtMTAx"b = base64.b64decode(a)print(b)c = "20201113-100"d = c.encode("utf-8")e = base64.b64encode(d)print(e)运行结果b’20201113-101’b’MjAyMDExMTMtMTAw’Process finished with exit code 0...

2020-11-13 18:00:17 234

原创 python代码打包，变成exe可执行文件

实现打包，需要使用Python第三方模块进行模块安装pip install pyinstaller使用上诉代码进行第三方模块的安装安装后再输入一下代码进行测试pyinstaller --version如报错，从头再进行。打包过程通过 CMD 打开"命令提示窗口" ，输入：pyinstaller + -F + 要打包的py文件路径例如：pyintaller -F D:\用户\python\项目.py运行该代码后，可在结果倒数第2行为EXE：的提示后找到打包成功的文件...

2020-11-06 15:38:42 798 1

原创爬虫urllib.error.URLError: ＜urlopen error [Errno 11001] getaddrinfo failed＞报错

爬虫报错---->>>>urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed>如下网络问题！！！！！！！！！！！！！

2020-10-27 16:58:58 4923 2

原创 python实现斐波那契数列简单易懂

a = int(input("需要多少项"))def fbna1(n): a,b=0,1 i = 0 while i < n: a,b=b,a+b yield a i += 1fb = fbna1(a)print("fb",fb)for i in fb: print(i)一下为运行测试:需要多少项10fb <generator object fbna1 at 0x000002680214D93

2020-10-26 10:33:00 272

原创递归函数展示斐波那契

def fbnq(n): if n == 1 or n == 0: return 1 else: fbnq(n-1) + fbnq(n-2)

2020-10-26 09:50:45 138

原创 1024徽章点亮不了

发了博文，徽章缺没点亮。官方的说法是过几天就会显示点亮了，只要发了就都有，都不要慌～

2020-10-24 21:59:05 881 2

原创 1024徽章如何获得

1024徽章1024节快乐，当天在csdn发布手打博客。即可获得1024专属徽章。据说点亮有延迟！祝大家节日快乐~~~~

2020-10-24 20:18:09 248

原创 you_get的使用下载视频一步到位

可下载所有主流视频网页的视频import sysimport you_getdef a(url,path): sys.argv=["you-get","--playlist","-o",path,url] you_get.main()ab = " " #这个里面是视频网址if __name__ == '__main__': url = ab path= "D:\AIshaoNv\桌面\爬虫视频测试" #这里面是视频打算下载的路径 a(url,

2020-10-24 20:13:18 377 1

原创获取 CSDN 1024 程序员节勋章教程

2020.10.24，是众所周知的程序员节。在这一天可以获得1024程序员徽章，那么这个勋章具体怎么才能获得呢？在10.24日当天在csdn上发表一篇原创博文就可以了。是不是很简单呢。一般点亮会在一个小时左右完成。最后祝：各位程序猿们，头发常驻~节日快乐~...

2020-10-24 14:14:45 1344 5

原创 python 的LEGB法则--变量的查找顺序

#LEGB法则--变量的查找顺序a = 1def outer(): b = 2 def inner(): c = 3 print(c) # local局部作用域 print(b) # enclosing嵌套函数的外部函数作用域 print(a) # global全部作用域 print(max) # 内置作用域 inner()outer()运行结果321...

2020-10-24 14:04:29 634

空空如也

空空如也