自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

野猫炫的博客

不记录了,记了也记不住

  • 博客(155)
  • 问答 (1)
  • 收藏
  • 关注

原创 python爬虫js逆向入门

在浏览器中打开开发者工具,切换到 **Network** 面板,刷新页面,找到相关的请求,注意到请求 URL 中有一个 `_signature` 参数。2. **找到相关的 JS 代码**:在 **Sources** 面板中搜索并找到生成 `_signature` 的 JavaScript 代码。1. **发现反爬机制**:通过浏览器开发者工具,发现请求中有一个动态生成的 `_signature` 参数。5. **应用到数据爬取**:将生成的签名应用到实际请求中,爬取所需的数据。

2024-07-12 19:20:10 1244

原创 python有2个列表,如果列表2的元素在列表1中,就删除列表1的该元素,最后输出处理后的列表1

【代码】python有2个列表,如果列表2的元素在列表1中,就删除列表1的该元素,最后输出处理后的列表1。

2024-07-12 16:15:46 150

原创 python 去除重复txt和章节

【代码】python 去除重复txt和章节。

2024-07-12 15:59:50 159

原创 python文本清洗

过滤html编码、网址、其他编码等。

2024-07-12 15:50:51 195

原创 python繁体字检测

【代码】python繁体字检测。

2024-07-12 15:46:09 92

原创 python数据清洗-找到重复的txt并输出字数最少的

【代码】python数据清洗-找到重复的txt并输出字数最少的。

2024-05-15 17:38:01 154

原创 数据清洗之匹配相同章节、统计重复次数最高的内容和次数并取不同字数之间的差集

取不同字数之间的差集是为了方便看多少字数比较合适,结论:30字好。

2024-05-14 16:56:48 114

原创 数据清洗-敏感词

【代码】数据清洗-敏感词。

2024-04-01 15:41:58 211

原创 python爬取bili弹幕

【代码】bili弹幕。

2024-03-26 18:32:22 133

原创 python数据清洗-小说(一)

【代码】数据清洗。

2024-03-26 16:20:34 191

原创 json互转jsonl,log-json

读取log文件,匹配写入json。jsonl转json文件。json转jsonl。

2024-02-06 11:44:55 787

原创 python拆分句子、去除句子符号等并分词

【代码】python拆分句子、去除句子符号等并分词。

2024-01-03 15:08:50 842 1

原创 中英文切割re.compile(r‘(\d+)(\D+)‘)

【代码】中英文切割re.compile(r'(\d+)(\D+)')

2023-12-14 15:57:24 504

原创 BeautifulSoup获取属性的 ul 元素

【代码】BeautifulSoup获取属性的 ul 元素。

2023-12-14 15:47:34 519

原创 from bs4 import BeautifulSoup

【代码】from bs4 import BeautifulSoup。

2023-12-13 16:46:17 402

原创 爬取bilibili视频

【代码】爬取bilibili视频。

2023-12-04 14:58:42 427

原创 银行业务测试

如客户数据的安全、资金的安全:银行主机的安全,应用程序的安全以及网络安全,某个环节出现问题都会给系统带来巨大的风险。大额存单: (1.20万起存,金额不能大于账户余额,2,期限:3个月1.9%,6个月2.1%,一年2.3%,2年2.8%,3年3.45%,5年3.55%,3.账号:只支持储蓄卡,不支持信用卡,4.提取支取: 转为活期)尾箱用于在系统中管理柜员的现金和凭证库存,每一位办理现金或凭证业务的柜员必须分配相应的尾箱,系统中尾箱与实物尾箱对应,营业终了,需要进行尾箱碰库,检查线上和实物尾箱信息是否。

2023-11-22 19:06:46 497

原创 python爬取某乎保存为json文件

【代码】python爬取某乎保存为json文件。

2023-11-22 16:35:12 135

原创 python txt json excel读写

if counter >= max_items_per_json or i == len(all_results) - 1: 检查是否已经处理了足够多的 datalist 或者已经是 all_results 中的最后一个 datalist。json_file_name = f'movie_iqiyi_wiki_per2_{file_count}.json' 生成 JSON 文件的文件名,包括文件编号。准备一个新的数据列表 model_data_out,用于存储更新后的数据。

2023-10-26 15:24:29 175

原创 python音频转文字调用baidu

python音频转文字调用的是百度智能云的接口,因业务需求会涉及比较多数字,所以这里做了数字的处理,可根据自己的需求修改。

2023-09-05 10:53:37 1354

原创 python视频播放接口

python视频播放接口。

2023-09-05 10:48:18 274

原创 python连接自己的机器人接口在微信聊天

机器人有连接到数据库,所以可以长记忆对话,多线程可以使得机器人同时和几个好友聊天。将消息发送到远程API进行处理,并回复处理后的消息。脚本还允许为每个好友分配一个唯一的随机 ID,以便跟不同的好友聊天并维护聊天记忆。

2023-09-05 10:41:49 792

原创 AttributeError: ‘ChatOpenAI‘ object has no attribute ‘predict_messages‘

AttributeError: 'ChatOpenAI' object has no attribute 'predict_messages'and 'predict'pip install langchain --upgrade --user

2023-08-28 16:24:51 292

原创 check_hostname requires server_hostname

可以考虑换一个python运行环境,也许是因为安装包的时候有代理导致的,建议重新建一个环境的时候,安装包的时候关闭代理。如果是在运行程序时出现这个错误,check_hostname requires server_hostname,

2023-08-28 16:22:44 805

原创 python正则表达式详解+判断密码是否符合要求

组合和嵌套正则表达式基本构建块是创建更复杂的模式以进行字符串匹配和搜索的关键。来创建分组,然后通过连接、选择和重复符号来组合和嵌套这些分组。来获取字符串的长度,并与指定的最小和最大长度进行比较。:用于定义反向字符集,匹配不在其中的任何一个字符。:匹配前面的元素至少 n 次但不超过 m 次。:匹配任何空白字符,包括空格、制表符、换行等。:匹配单词的边界,用于限定单词的开始或结束。:用于定义字符集,匹配其中的任何一个字符。:匹配输入字符串的结束,忽略换行符。:匹配前面的元素至少 n 次。

2023-08-24 17:45:17 2404

原创 python数组-刷题

遍历数组,对于每个位置 i,遍历其前面的所有位置 j,如果 nums[i] > nums[j],说明可以在递增子序列的末尾添加 nums[i],从而更新 dp[i]。如果 i >= 0,再次从后往前找到第一个大于 nums[i] 的数字的索引 j,交换 nums[i] 和 nums[j]。输入: intervals = [[1,3],[2,6],[8,10],[15,18]]输入: matrix = [[1,2,3],[4,5,6],[7,8,9]]

2023-08-24 16:35:02 302

原创 python字符串处理15题-刷题

给定一个只包含三种字符的字符串:'(', ')','{','}','[',']',判断字符串是否有效。给定一个字符串s,找出s中最长的连续子序列,使得子序列中的每个字符的前后相邻字符在原始字符串中也是相邻的。给定一个字符串,找到它的第一个不重复的字符,并返回它的索引。给定一个字符串 S 和一个字符串 T,请在 S 中找出包含 T 所有字母的最小子串。给定一个字符串s和一组字符t,找出s中包含t中所有字符的最小子串。找出最后一个单词的长度。输出: [["aa","b"], ["a","a","b"]]

2023-08-24 16:00:00 1493

原创 concurrent.futures实现并发地发送多个请求

使用一个循环来处理每个提交的任务。使用了线程池来并发地发送多个请求,并且可以在 texts 列表中添加需要转换的多个文本。使用 ThreadPoolExecutor 来创建一个线程池,其中的 max_workers 参数指定了线程池中的最大线程数量。循环结束后,我们遍历 output_data_list 列表,输出每个文本对应的转换后音频数据,并将数据写入以文本内容命名的输出文件中。对每个请求的结果进行处理,将成功的请求结果保存在 output_data_list 列表中,处理失败的请求并输出错误信息。

2023-08-24 15:23:09 127

原创 Linux配置nginx反向代理

错误信息:nginx: [alert] could not open error log file: open() "/usr/local/nginx/logs/error.log" failed (13: Permission denied)使用 :wq 命令保存文件时,确保文件路径正确,文件名正确且包含在 /etc/nginx/sites-available/ 目录中。在云服务器上部署高并发的服务,使用Nginx作为反向代理是一种常见的做法,可以实现流量分发、负载均衡,同时提升系统的可靠性和性能。

2023-08-24 12:19:23 1031

原创 部署常用指南

环境配置安装和配置 Anaconda安装 Anaconda。配置镜像源:yaml。

2023-08-23 12:16:59 580

原创 RuntimeError: Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is Fal

请注意,如果您之前已经安装了其他版本的 NVIDIA 驱动,您可能需要在安装新驱动之前卸载现有的驱动。这样应该可以显示出您系统中可用的 NVIDIA 驱动版本。然后,您可以根据之前的步骤选择并安装适当的驱动版本。例如,如果您想要最新的服务器级别驱动,您可以选择。根据上一步的输出,选择要安装的 NVIDIA 驱动版本。首先,您可以查看当前可用的 NVIDIA 驱动版本。如果该命令显示有关您的 NVIDIA GPU 的信息,则表示驱动已成功安装。这将显示您的系统上可用的 NVIDIA 驱动版本列表。

2023-08-23 10:42:25 2007

原创 unittest单元测试

单元测试中的“用例”(或“测试用例”)是指对软件中的特定功能、行为或部分进行测试的一组步骤和验证。每个测试用例都应该测试一个特定方面的代码,例如一个函数、一个方法或一个类的某个方法。导入所需的模块和函数:首先,需要导入要测试的模块和相关的函数、类或方法。当你运行这个测试文件时,测试运行器会自动执行所有测试方法,并显示测试的结果。编写测试方法:在测试类中,为每个要测试的功能编写一个测试方法。如果有测试失败,你会看到相应的错误信息和失败的测试用例。运行测试后,会显示测试是否通过以及测试覆盖的部分。

2023-08-10 14:55:01 1181

原创 git lfs installError: Failed to call git rev-parse --git-dir: exit status 128 Git LFS initialized.

解决方法很简单:首先,你需要进入一个已经初始化为Git仓库的目录,然后再执行Git LFS相关的命令。在进入正确的Git仓库目录后,你可以继续进行Git LFS的安装和更新操作。:如果你在一个受限制的目录下执行Git LFS命令,可能会导致权限问题。:首先,请确认你确实在一个有效的Git仓库目录中执行了这个命令。:如果你已经安装了Git LFS,请确保它是最新版本。之前,请确认你是否已经在系统中安装了Git LFS。如果你已经在一个Git仓库目录中但仍然遇到问题,请确保你在执行。来检查Git的版本信息。

2023-08-04 14:32:27 6090

原创 Python深浅拷贝

浅拷贝适用于处理简单的数据结构,如列表、字典、集合等,当你需要复制对象,但对象内部没有嵌套对象或者嵌套对象共享同一个引用时,可以使用浅拷贝。例如,当复制一个简单的列表时,浅拷贝会创建一个新的列表对象,但列表内部的元素仍然是原始列表的引用,因此修改新列表会影响原始列表。深拷贝适用于处理复杂的数据结构,如嵌套的列表、嵌套的字典、自定义对象等,当你希望复制整个对象结构,以确保所有嵌套对象都是独立的、不共享引用时,应该使用深拷贝。复制对象:在某些情况下,我们需要复制一个对象,但又不希望复制对象内部的引用关系。

2023-08-02 16:16:11 343

原创 python题-将多个Linux文件夹路径转换为JSON形式

如果值不是一个字典,说明它是一个文件夹名字,我们把它变成一个只包含一个键值对的字典,键是"name",值是文件夹名字本身。当值是一个字典时,说明该文件夹是一个嵌套的文件夹,因此我们需要对这个字典进行递归处理,继续向下遍历嵌套的层级。中,我们遍历每个键值对,其中键是文件夹名字,而值可能是一个字典(嵌套的文件夹)或字符串(文件夹名字本身)。不是一个字典,说明它是一个文件夹名字,我们就将它变成一个只包含一个键值对的字典,键是。当值是一个字符串时,说明该文件夹是一个单独的文件夹,我们就将它变成一个包含。

2023-08-01 18:02:16 507

原创 python题-检查该字符串的括号是否成对出现

如果括号栈的栈顶元素是左括号,那么我们可以从字典中查找该左括号对应的右括号,然后与当前右括号进行比较。如果匹配成功,说明这对括号是成对匹配的,我们可以将左括号栈的栈顶元素弹出,表示这对括号已经匹配。如果匹配不成功,或者括号栈为空(即没有与之匹配的左括号),那么括号未正确配对,返回False。在处理括号问题时,栈可以帮助我们跟踪左括号的顺序,以便在遇到右括号时进行匹配。当我们处理括号的成对匹配时,栈可以帮助我们跟踪左括号的顺序,以便在遇到右括号时进行匹配。字典中的键是左括号,值是对应的右括号。

2023-08-01 16:49:58 1275 2

原创 python

例如,一个Web应用程序需要频繁地查询数据库获取用户信息,可以将这些查询结果缓存到Redis中,下次查询同样的信息时,先尝试从Redis中获取,如果存在则直接返回,避免了频繁查询数据库,提高了应用程序的响应速度和性能。Redis可以用作分布式锁的实现,通过Redis的SETNX命令(当键不存在时设置键的值)来实现锁的获取,避免了并发访问导致的竞态条件。例如,一个在线聊天应用中,用户发送的消息可以通过Redis的发布功能发布到指定的频道,然后其他用户通过订阅相应的频道来接收消息,实现即时通讯功能。

2023-08-01 11:04:06 1058

原创 输出不同程序执行的时间

简单的测试工具代码,它可以输出不同程序执行的时间。我们可以使用Python的。运行代码后,将输出该函数的执行时间。你可以根据需要测试其他函数,只需在。,并将要测试的函数和参数传递给它。在这个示例中,我们测试了。来测试其他函数的执行时间。函数的执行时间,并传递了参数。模块来实现这个功能。

2023-08-01 09:48:22 169

原创 计算语言模型计算每秒钟生成的token数量it/s

函数的stream循环中,我们可以计算每秒钟生成的token数量,然后输出。在流式生成过程中,我们可以使用Python的。

2023-08-01 09:44:35 4355

原创 算法(c和python)-排序-冒泡排序

冒泡排序是一种简单的排序算法,它重复地遍历待排序的列表或数组,依次比较相邻的两个元素,如果它们的顺序不正确就交换它们的位置,直到整个列表或数组排序完成为止。冒泡排序得名于类似水泡上浮的排序过程,较大(或较小)的元素会像气泡一样浮到列表或数组的一端。冒泡排序的基本思想如下:从列表或数组的第一个元素开始,依次比较相邻的两个元素。如果前面的元素大于(或小于)后面的元素(根据升序或降序决定),则交换这两个元素的位置,使得较大(或较小)的元素浮到列表或数组的一端。继续进行第1步和第2步,直到整个列表或数组

2023-07-21 18:21:20 433

空空如也

python 两数之和

2021-05-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除