自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

地中海的博客

向秃头进军!

  • 博客(58)
  • 收藏
  • 关注

原创 python图片验证码识别-基于机器学习的muggle_ocr图片验证码识别

开源项目muggle-orc 感谢原作者的辛苦创作 感谢阿J大佬的分享(白嫖)这是一个为麻瓜设计的本地OCR模块 只需要简单几步操作即可拥有两大通用识别模块,让你在工作中畅通无阻。这个将0识别为o了,这边将源码中的字符列表等全换为数字列表,识别单数字验证码准确率会高很多。SDK类参数参数名必选类型说明model_typeNoModelType指定预置模型类型conf_pathNostr指定自定义模型yaml配置文件(绝对路径)以上参数两者.

2021-05-28 09:28:41 998 2

原创 Python喜马拉雅有声小说音频文件爬虫

今天爬取的是喜马拉雅有声小说。目标网址:https://www.ximalaya.com/youshengshu/分析操作开始:首先在喜马拉雅有声小说页面,播放任意音频。当播放音频时,打开抓包工具(加载网页后打开抓包工具,发现没有抓到数据包,刷新网页就行),这边选择媒体Media,一般的视频,音频文件都会在这里被抓取到。下图就是抓到的音频文件。我们尝试访问一下该接口的url,将url复制到浏览器打开。发起访问后,跳转出了一个保存文件到本地的界面。我们选择保存,发现多了一个类型

2021-03-18 09:23:42 12195 21

原创 Python爬虫案例,腾讯动漫爬虫,步骤超详细解释。

实施步骤(1) 数据爬取:使用requests请求为基础获取数据源。(2) UA伪装:模拟浏览器访问网址。(3) 数据解析:使用xpath语法处理数据。(4) 数据存储:获取需求数据后使用Excrl进行存储目标网址https://ac.qq.com/Comic/all/search/hot/page/1库的使用Openpyxl:openpyxl 模块是一个读写 Excel 2010 文档的 Python 库,如果要处理更早格式的 Excel 文档,需要用到其它库(如:xlrd、xlwt 等)

2020-12-28 10:41:51 4632 6

原创 爬虫模板 !request基础模块------>>模板

01request.测试import requestsclass RequestSpider(object): def __init__(self): url = "https://www.baidu.com/" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrom

2020-11-27 11:38:58 1819 1

原创 有道翻译js逆向

有道翻译两个加密,一个是sign用了MD5加密,另一个是返回值AES加密,AES的密匙还用md5加密了一下。先看看第一个含有sign的,打个断点发现返回值29a…明显不对,第二个点击发现跟第一个是一样的。k函数的作用 就是组成一个 除了时间戳 不一样,其他都一样的字符串。首先还是sign那里打断点,然后运行,追踪。再点击第三个搜索结果,看看第三个含有sign的,打个断点测试一下。digest(‘hex’)的意思就是返回16进制的值。很明显这个K函数返回的就是我们需要的sign。最后返回的就是sign的值。

2024-04-15 16:49:06 243

原创 Python装饰器教学

在Python中,装饰器是一种高级语法特性,允许你修改或增强函数、方法或类的行为,而无需修改其源代码。装饰器本质上是一个接受函数作为参数的函数,并返回一个新的函数对象。日志记录是装饰器的一个非常实用的应用场景。装饰器用于保留原始函数的元信息,这样在日志中就可以正确地显示函数名。这样,我们就可以通过传递不同的参数来创建具有不同行为的装饰器。的装饰器,它接受一个函数作为参数,并返回一个新的函数。语法,我们可以将装饰器应用到任何函数上,如。是一个返回装饰器的函数。是一个装饰器函数,它接受一个函数。

2024-03-26 17:22:41 539

原创 * 和 **

在实际开发中,类似的技巧可以用于创建中间件、插件系统、事件处理器等需要高度灵活性和可扩展性的场景。用户可以传递他们需要的任何参数,而你的代码只需要关心处理这些参数的核心逻辑。:在复杂的函数调用链中,一个函数可能需要将接收到的参数原封不动地传递给另一个函数。编写的函数更容易适应这些变化,因为它们可以接受新类型的参数而无需修改函数签名。,它包含了要传递给函数的前三个位置参数的值。来构建一个灵活的函数装饰器,该装饰器可以用于记录函数调用的信息。的灵活性,使得它可以无需修改就能用于具有不同参数签名的多个函数。

2024-03-26 17:21:51 489

原创 Python项目管理利器poetry我愿称之为神!

在当前的工作目录中初始化一个新的poetry项目非常简单,只需要在命令行中运行poetry new project_name,这将创建一个新的项目目录并生成初始的项目文件。在管理完依赖项后,通过运行 poetry install 命令,poetry 将会按照 pyproject.toml 文件中定义的依赖关系,安装所有项目所需的依赖项。在上述示例中,poetry 会在项目的虚拟环境中执行 main.py 文件,并自动使用项目定义的依赖项。这样,使用 poetry,我们能够轻松地管理项目的打包和发布流程。

2023-12-02 12:44:30 182 3

原创 java算数运算符-笔记

java基础

2022-05-31 22:44:11 261

原创 jupyter notebook报错500 : Internal Server Error

jupyter notebook报错500 : Internal Server Errorpip install --upgrade --user nbconvert

2021-06-17 21:44:13 1080 4

原创 Python抽帧生成手绘风视频

主要分为三部分,抽帧,每帧转手绘风,再将所有照片拼接成视频。主要是第二部,大家可以尽情发挥转字符串画之类的都可以。冲!第一部分视频抽帧import osimport cv2def extract_frames(video_path, dst_folder, index, frame_num): video = cv2.VideoCapture() if not video.open(video_path): print("can not open the vid

2021-04-24 09:27:42 320 1

原创 毛豆汽车数据爬虫--附源码

毛豆汽车数据爬虫–附源码没啥教程就是简单的爬虫 加个正则 有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:毛豆# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 14:22import requestsfrom fake_useragent import UserAgentimport reimport csvheaders =

2021-04-07 21:33:18 179

原创 链家爬虫获取链家网页数据-附带源码

链家爬虫没啥教程就是简单的爬虫 加个正则 有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:链家# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 10:19import requests, refrom fake_useragent import UserAgentimport timeimport csvheaders =

2021-04-07 18:13:40 741 1

原创 python安装telegram.ext No matching distribution found for ‘telegram.ext’

python安装telegram.extpip install python-telegram-bot

2021-03-24 19:50:16 887

原创 No module named ‘alipay‘

No module named ‘alipay’解决办法pip install python_alipay_sdk

2021-03-08 09:42:56 1971

原创 No module named ‘pywin32_bootstrap‘

No module named ‘pywin32_bootstrap’解决方法!!pip install --ignore-installed pywin32==225

2021-03-08 09:40:35 579

原创 JD京东爬虫-商品评论爬虫-----附源码

JD京东爬虫-商品评论爬虫附源码本教程适合初学者。分析开始---------------打开京东商品链接,打开抓包工具(加载网页后打开抓包工具,发现没有抓到数据包,刷新网页就行),这边直接筛选js了,就不用看那么多内容。然后在响应数据中看看有没有想要的评论数据。然后双击抓到的数据包,或者复制url进入浏览器。打开后发现是json数据,看到这里是不是头皮发麻,哈哈哈,不要慌!管它呢么多,咱们要的是文字的评论数据,直接使用正则就好了。有时不得不说,正则真的是很好用的。但是细心地同志会

2021-03-08 08:51:15 10693 32

原创 python实现投票问题。

新学年开始﹐小羊所在的班级要重新选举新一届的班长。为保证公平公正,选举采用无记名投票的方式,每名同学依次在选票上写上自己支持的候选人姓名。通过唱票﹐得票最高的候选人当选为新一届的班长。(题目数据保证仅有一人获得最高票)。count = int(input())all_name_tic = {}for i in range(count): name = input() if name not in all_name_tic: all_name_tic[name] =

2021-01-08 11:04:18 5085

原创 python实现周末舞会问题

假设在周末舞会上,男士们和女士们进入舞厅时,各自排成一队。跳舞开始时,依次从男队和女队的队头上各出一人配成舞伴。规定每个舞曲能有一对跳舞者。若两队初始人数不相同,则较长的那一队中未配对者等待下一轮舞曲。现要求写一个程序,模拟上述舞伴配对问题。n,m =map(int,input().split())k = int(input())man = list(range(1,n + 1))woman = list(range(1, m + 1))while True: if len(man) =

2021-01-08 11:02:18 1507

原创 群友专享

爬虫技术交流链接:https://pan.baidu.com/s/1OQWrQiLgFouulz0Uv1o9ww提取码:2sn2复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V2的分享

2021-01-07 17:13:32 286

原创 京东抢茅台脚本python

原作者链接https://github.com/huanghyw/jd_seckill/tree/master部署好了,哈哈哈谢谢作者开源!

2021-01-05 14:56:07 1947 1

原创 IP接口每10分钟自动获取

# -*- endoding: utf-8 -*-# @ModuleName:淘宝客户py# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/1/3 2:20import requestsimport timeurls = ['http://www.*********************', 'http://gev.qydai********', 'http://api.66daili.cn/API/GetSe

2021-01-04 08:17:33 694

原创 豆瓣爬虫 详情页保存成Excel

需求爬取豆瓣电影详情页详细数据。排名链接电影名主演评分评价人数年份类型制片国家/地区导演语言上映日期片长简介源码如下:import requests, json, openpyxlfrom lxml import etreewb = openpyxl.Workbook()sheet = wb.activesheet_name = ['排名', '链接', '电影名', '主演',

2021-01-04 08:03:43 800 2

原创 异或加密 并暴力破解测试破解密码可行性

key = key * (len(plaintext) // len(key)) + key[:len(plaintext) % len(key)]#取整数/余数 ciphertext=[] for i in range(len(plaintext)): ciphertext.append(str(ord(plaintext[i])^ord(key[i]))) key = ','.join(ciphertext)密码枚举测试...

2021-01-04 07:59:04 1651 1

原创 WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne

“ WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne”报错pip install xxx -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

2020-12-29 20:58:00 254

原创 RuntimeError: ‘cryptography‘ package is required for sha256_password or caching_sha2_password auth m

RuntimeError: ‘cryptography’ package is required for sha256_password or caching_sha2_password auth methods报错启动Django时报错解决方法:pip install cryptography

2020-12-24 10:58:53 560

原创 Django框架创建入门流程

DjangoSQLite轻量级的嵌入式级的数据库特点是小常用场景Android IOS WP数据库常规操作相似度和MySQL达百分之九十五快捷键万能键-alt + 回车实现一个请求注册一个路由urls中url参数① 匹配规则 正则视图函数对应的是views中的一个函数没有括号去views实现对应的视图函数第一个参数是request永远记得返回Responsehtml快捷键ul>liul*5

2020-12-09 20:44:11 100 1

原创 tkinter模块 实现贪吃蛇小游戏 项目实战

# -*- endoding: utf-8 -*-# @ModuleName:贪吃蛇# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2020/11/30 21:57import timefrom tkinter import *import randomaaaa = []# basic game configurationdef clicked(event): passdef growSnake(): global sc

2020-12-07 11:42:17 628

原创 UnicodeEncodeError: ‘gbk‘ codec can‘t encode character解决办法

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\ue615’ in position 488084: illegal multibyte sequence 解决办法with open('baidu.html', 'w', encoding='utf-8') as f: f.write(data)

2020-11-25 20:00:55 2069 1

原创 Scrapy爬虫框架 模板 及 笔记。

import scrapy # 导入scrapy# 创建爬虫类 并且继承自scrapy.Spider --> 最基础的类 另外几个各类都是继承自这个类class ProxySpider(scrapy.Spider): name = 'proxy' # 爬虫名字--> 必须唯一 allowed_domains = ['cn-proxy.com'] # 允许采集的域名 start_urls = [f'http://cn-proxy.com/{page}' f

2020-11-17 09:11:17 2874

原创 使用Base64包加密和解密 ----Python

a 为 一个加密的字符串c 为需要加密的字符串import base64a = "MjAyMDExMTMtMTAx"b = base64.b64decode(a)print(b)c = "20201113-100"d = c.encode("utf-8")e = base64.b64encode(d)print(e)运行结果b’20201113-101’b’MjAyMDExMTMtMTAw’Process finished with exit code 0...

2020-11-13 18:00:17 187

原创 python代码打包,变成exe可执行文件

实现打包,需要使用Python第三方模块进行模块安装pip install pyinstaller使用上诉代码进行第三方模块的安装安装后 再输入一下代码进行测试pyinstaller --version如报错,从头再进行。打包过程通过 CMD 打开"命令提示窗口" , 输入:pyinstaller + -F + 要打包的py文件路径例如:pyintaller -F D:\用户\python\项目.py运行该代码后,可在结果倒数第2行 为EXE:的提示后找到打包成功的文件...

2020-11-06 15:38:42 737 1

原创 爬虫urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed>报错

爬虫报错---->>>>urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed>如下网络问题!!!!!!!!!!!!!

2020-10-27 16:58:58 4818 2

原创 python实现斐波那契数列 简单易懂

a = int(input("需要多少项"))def fbna1(n): a,b=0,1 i = 0 while i < n: a,b=b,a+b yield a i += 1fb = fbna1(a)print("fb",fb)for i in fb: print(i)一下为运行测试:需要多少项10fb <generator object fbna1 at 0x000002680214D93

2020-10-26 10:33:00 212

原创 递归函数展示斐波那契

def fbnq(n): if n == 1 or n == 0: return 1 else: fbnq(n-1) + fbnq(n-2)

2020-10-26 09:50:45 92

原创 1024徽章点亮不了

发了博文,徽章缺没点亮。官方的说法是过几天就会显示点亮了,只要发了就都有,都不要慌~

2020-10-24 21:59:05 800 2

原创 1024徽章如何获得

1024徽章1024节快乐,当天在csdn发布手打博客。即可获得1024专属徽章。据说点亮有延迟!祝大家节日快乐~~~~

2020-10-24 20:18:09 193

原创 you_get的使用 下载视频一步到位

可下载所有主流视频网页的视频import sysimport you_getdef a(url,path): sys.argv=["you-get","--playlist","-o",path,url] you_get.main()ab = " " #这个里面是视频网址if __name__ == '__main__': url = ab path= "D:\AIshaoNv\桌面\爬虫视频测试" #这里面是视频打算下载的路径 a(url,

2020-10-24 20:13:18 310 1

原创 获取 CSDN 1024 程序员节勋章教程

2020.10.24,是众所周知的程序员节。在这一天可以获得1024程序员徽章,那么这个勋章具体怎么才能获得呢?在10.24日当天在csdn上发表一篇原创博文就可以了。是不是很简单呢。一般点亮会在一个小时左右完成。最后祝:各位程序猿们,头发常驻~节日快乐~...

2020-10-24 14:14:45 1256 5

原创 python 的LEGB法则--变量的查找顺序

#LEGB法则--变量的查找顺序a = 1def outer(): b = 2 def inner(): c = 3 print(c) # local局部作用域 print(b) # enclosing嵌套函数的外部函数作用域 print(a) # global全部作用域 print(max) # 内置作用域 inner()outer()运行结果321...

2020-10-24 14:04:29 511

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除