- 博客(185)
- 收藏
- 关注
原创 Python 进阶之路 03:运算符——给你的代码装上驱动马达
本文介绍了Python中三类主要运算符:算术运算符(加减乘除、取余等)、比较运算符(等于、大于等)和逻辑运算符(与或非)。通过示例演示了运算符的使用场景,如算术运算中的整除与浮点除区别,比较运算的真假判断,以及逻辑运算的多条件组合。最后通过BMI计算器案例综合运用所学知识,并布置了相关练习题目。文章旨在帮助初学者掌握Python运算符的基础用法,为后续编程学习打下基础。
2025-12-25 16:38:13
18
原创 Python 进阶之路 02:数据类型——看透变量的“真面目”
本文介绍了Python四大基础数据类型:数字类型(整数int、浮点数float)、字符串str、布尔值bool。重点讲解了数据类型的特点和转换方法,包括type()查看类型、int()/str()转换类型。特别提醒了浮点数精度问题和input()默认返回字符串的特性。通过"简易工资计算器"的课后任务,帮助读者巩固数据类型转换的实际应用。
2025-12-25 16:36:16
19
原创 Python 进阶之路 01:变量——给你的数据起个“绰号”
摘要:本文介绍了Python编程中的变量概念。变量是存储数据的"标签",通过名称访问内存中的数据。Python变量定义简单,无需声明类型,支持动态类型转换。文章详细讲解了变量命名规则(字母/数字/下划线,区分大小写)和行业命名建议(如snake_case)。同时指出初学者常见错误(拼写错误、漏引号等),并建议通过定义个人信息变量进行实践练习。变量作为编程基础,是掌握数据处理的第一步,为后续学习数据类型奠定基础。
2025-12-25 16:33:26
126
原创 IndexTTS2本地部署与使用教程:B站开源的情感语音合成神器
IndexTTS2是哔哩哔哩团队开源的一款突破性语音合成工具,支持零样本声音克隆和精准情感控制。该文详细介绍了本地部署方法:需6GB以上显存,通过Git克隆源码后,推荐使用UV包管理器快速安装依赖。模型可从ModelScope或HuggingFace下载(约7-8GB)。系统提供四种情感控制方式:音色参考、情感参考、情感向量滑块和文本描述。高级配置包括显存优化和DeepSpeed加速功能,适用于视频配音、虚拟主播等场景。该工具在情感表达和时长控制方面实现重大突破,显著降低了高质量语音合成的技术门槛。
2025-10-20 16:52:04
1867
原创 完整教程:大语言模型评估指南 - 使用Lamini和Hugging Face
本教程详细介绍了微调后大型语言模型的评估方法。主要内容包括:1)通过HuggingFace加载测试数据集和微调模型;2)使用精确匹配和相似度匹配等指标评估模型性能;3)实现单样本和批量推理测试流程;4)利用LM评估工具包进行标准化评估;5)提供错误处理和批量优化等实用技巧。评估过程涵盖环境设置、数据准备、模型推理、结果分析和可视化展示,帮助开发者全面了解模型实际表现,识别改进空间,为部署决策提供依据。
2025-10-16 17:17:04
1181
原创 完整博客教程:使用Lamini和Hugging Face进行大语言模型微调
本文详细介绍了如何使用Lamini库和HuggingFace Transformers微调大型语言模型。教程涵盖环境配置、数据预处理、模型加载、训练参数设置、微调流程及性能评估等关键步骤。通过实际代码演示,展示了如何将通用语言模型(如Pythia-70M)适配到特定领域(Lamini文档),并对比了基础模型与微调模型的输出差异。特别强调了Lamini工具在简化微调过程中的作用,适合不同技术背景的开发者使用。文章还探讨了模型大小、训练步数等参数对效果的影响,为NLP实践提供了实用指导。
2025-10-16 17:06:57
823
原创 指令微调:从基础模型到专业助手的蜕变
本文介绍了指令微调技术如何将基础语言模型转化为智能指令助手。通过对比基础模型和指令微调模型的输出差异,展示了指令微调在结构化响应、任务适应性和安全性方面的优势。文章详细解析了Alpaca数据集的使用、数据预处理方法,以及模型推理过程,并通过文档问答系统示例演示了实际应用效果。同时指出指令微调面临的挑战(数据质量、过拟合风险等)和最佳实践(数据多样性、渐进式训练等),展望了多模态理解、个性化微调等未来发展方向。指令微调技术正推动AI助手向更实用、智能的方向演进。
2025-10-15 16:20:19
1010
原创 Gemini CLI 完整介绍与部署教程
文章摘要: GeminiCLI是Google推出的命令行工具,支持通过终端与Gemini AI模型交互,适用于文本生成、多模态文件处理等任务。其核心特性包括跨平台支持、多轮对话、图像/PDF分析及灵活参数配置。部署需Python 3.8+、Google Cloud账户及API密钥,通过pip或源码安装后配置环境变量即可使用。基础功能涵盖单次查询、交互对话、文件处理(如总结文档、分析图片),支持调整温度、token数等生成参数。进阶应用可集成到脚本或批量处理文件,需注意API密钥保护及调用频率限制。官方提供详
2025-10-15 16:13:26
2202
原创 完整指南:使用Hugging Face Datasets处理和准备LLM微调数据
本教程介绍了使用HuggingFace Datasets库处理LLM微调数据的完整流程。主要内容包括:1)使用流式加载处理大型数据集;2)从JSONL文件加载和转换指令数据;3)构建问答提示模板;4)创建文本序列和问答对两种数据集格式;5)数据清洗和分割技巧;6)准备上传到HuggingFace Hub。教程强调数据质量检查、内存管理和版本控制等最佳实践,为开发者提供了从数据加载到预处理的完整指南,帮助实现高效的LLM微调。
2025-10-14 11:18:53
594
原创 从基础到微调:使用Lamini运行Llama-2模型的完整指南
本文介绍了如何使用Lamini库运行和比较不同版本的Llama-2模型。首先配置环境并加载基础模型Llama-2-7b-hf,测试其在宠物训练、火星知识、流行文化等场景的表现。然后对比微调后的Llama-2-7b-chat-hf模型,发现其在对话任务中表现更优秀,尤其擅长处理指令格式[INST]。分析显示基础模型更适合事实性信息检索,而微调模型在对话系统和用户体验方面更胜一筹。文章提供了模型选择建议和最佳实践,展示了Lamini库简化大型语言模型交互的优势。
2025-10-14 11:09:32
452
原创 JavaScript变量完全指南:从基础定义到高级用法
本文系统介绍了JavaScript变量的核心知识。首先阐述了JS作为弱类型语言的特点,变量类型由赋值决定,但需注意类型转换问题。详细讲解了5种基本数据类型(Number、String、Boolean、Undefined、Null)和1种复合类型(Object),包括特殊值NaN和Infinity。重点解析了变量命名规范:区分大小写、首字符规则、驼峰命名法等最佳实践,强调避免使用保留字。还介绍了现代JS的let和const声明方式,以及变量作用域概念。最后总结了良好的变量命名和数据类型使用对代码可维护性的重要
2025-10-13 13:42:46
169
原创 JavaScript逆向工程完全指南:从加密原理到实战应用
JavaScript逆向工程是对JavaScript代码进行反向分析以理解其工作原理的过程,不同于解密还原明文。前端加密用于保护数据传输安全,常见方式包括:请求头加密(自定义Token、签名)、请求参数加密(Base64/AES)、Cookie验证、响应数据加密和全链路加密。逆向技巧包括代码定位(关键词搜索、断点调试)、参数追踪和算法识别。实战案例演示了模拟企查查加密请求头的方法。需注意法律边界,遵守Robots协议、控制请求频率,仅用于学习研究。逆向工程是技术学习手段,应遵循道德规范。
2025-10-13 13:34:49
1115
原创 QQmusic sign值逆向实战 - Webpack打包分析
本次逆向分析针对QQmusic采用Webpack打包的复杂前端架构,重点研究window._P签名函数的实现机制。与传统的全局函数不同,QQmusic将核心逻辑封装在Webpack模块中,通过window.ddd(0)进行模块初始化,增加了逆向分析的难度。
2025-10-12 15:01:09
1104
原创 J东h5st逆向实战
h5st是某东网页端的反爬虫参数,主要用于保护核心接口免受机器请求的干扰。该参数通过复杂的JavaScript代码生成,涉及加密、签名等多种前端安全技术。本笔记通过分析京东首页feed流接口的h5st参数生成过程,揭示其实现原理。
2025-10-12 14:09:54
355
原创 拼多多电商数据anti-content参数逆向实战
拼多多作为国内主流电商平台,其网页端和移动端的数据接口都采用了严格的反爬虫机制。其中 anti-content 参数是一个重要的反爬虫签名参数,用于验证请求的合法性,防止恶意爬取和数据抓取。
2025-10-09 14:35:15
1068
4
原创 抖音a_bogus参数加密逆向
本技术文档详细记录了针对抖音Web端反爬机制中a_bogus参数的逆向工程过程。该参数是抖音API请求中的关键加密参数,用于验证请求的合法性。通过完整的环境模拟和Hook技术,我们成功实现了该参数的本地生成。canvas = {
2025-10-09 11:04:22
475
原创 喜马拉雅音频链接逆向实战
实现了一个喜马拉雅音频链接的解密功能,能够将加密的音频链接转换为可用的真实链接。代码主要使用了Base64解码和自定义的XOR异或操作进行解密。这段代码展示了喜马拉雅音频链接的解密过程,结合了Base64编码、字节置换和异或操作等多种技术。理解这个过程有助于分析喜马拉雅的音频获取机制,并可用于开发相关工具或进行进一步的安全研究。
2025-10-09 11:01:35
162
原创 补环境-JS原型链检测:在Node.js中完美模拟浏览器原型环境
本文详细探讨了JavaScript逆向工程中原型链检测的原理及应对方法。首先介绍了原型链基础概念和网站使用检测的目的(反爬虫、安全防护等),然后分析了浏览器与Node.js环境的差异。重点讲解了在Node.js中模拟浏览器环境的完整方案:使用jsdom库创建基础环境、修复构造函数检测、深度模拟原型链、处理属性描述符检测等。文章还提供了完整的浏览器环境模拟类实现,并分享了实战案例和调试技巧。最后总结了最佳实践和未来趋势,强调环境模拟需要持续更新和针对性调整。
2025-09-19 11:55:08
1115
原创 构建轻量级Flask Web框架:从入门到实践
本文介绍了如何从零开始构建一个轻量级但功能完备的Flask框架。Flask作为Python生态中的微框架,具有简洁灵活、可扩展的特点。文章详细讲解了项目结构设计、核心功能实现和扩展方法,包括配置管理、应用工厂模式、路由设计、模板系统等基础功能,以及数据库集成、用户认证、REST API开发等高级功能扩展。同时提供了生产环境部署实践和性能优化建议。通过模块化设计和渐进式增强,该框架既能快速开发小型项目,又能扩展支持大型应用需求,是Flask开发的实用指南。
2025-08-11 14:41:04
644
原创 使用Python异步爬虫抓取并解析网页内容
本文介绍了使用Python异步爬虫技术抓取网页内容的方法,重点讲解了如何利用BeautifulSoup解析特定div中的文本。文章通过完整代码示例,展示了使用asyncio异步框架和crawl4ai爬虫库实现高效网页抓取的过程,详细说明了通过style属性匹配目标div并提取文本的技术要点。该方案适用于网络小说、新闻文章等内容抓取场景,同时强调了遵守robots规则和异常处理的重要性。这套技术结合了异步编程的高效率和BeautifulSoup的灵活解析能力,为网页数据抓取提供了实用解决方案。
2025-08-11 14:27:14
688
原创 重庆大学登录加密逆向实战
本笔记分析重庆大学统一身份认证系统(authserver.cqu.edu.cn)的登录过程中密码加密的实现方式。系统使用AES-128-CBC加密算法对用户密码进行加密处理,前端JavaScript代码负责加密逻辑,而后端则进行解密验证。
2025-08-04 16:24:52
968
原创 用Python绘制SM2国密算法椭圆曲线:一场数学与视觉的盛宴
椭圆曲线密码学是基于椭圆曲线数学理论的公钥加密体系。与传统的RSA相比,ECC能在更短的密钥长度下提供同等的安全性。SM2采用的sm2p256v1曲线定义在素数域GF(p)上,其标准方程为:通过这个项目,我们不仅将抽象的密码学概念可视化,还创造了一件科技艺术品。这种跨界的尝试展示了STEM领域的创意可能。希望这个可视化能激发您对国密算法和密码学的兴趣!plt.show()
2025-07-31 16:46:27
840
原创 国密算法在JavaScript逆向加密中的应用与实践
国密算法是由中国国家密码管理局制定的一系列密码算法标准,包括SM1、SM2、SM3、SM4等,是我国自主研发的商用密码体系。
2025-07-31 09:45:17
1737
原创 使用Python自动化破解极验滑块验证码的完整指南
本文介绍了使用Python破解极验(GeeTest)滑块验证码的技术方案。采用DrissionPage实现浏览器自动化,结合ddddocr进行图像识别,通过Canvas获取验证码图片并解码处理。关键步骤包括:模拟用户登录触发验证、获取并处理验证码图片、计算滑块缺口位置、模拟人类滑动行为。文章详细解析了图片数据转换、缺口识别算法和滑动轨迹模拟等技术难点,同时强调该方法仅限合法用途,提醒开发者遵守相关法律法规。随着验证码技术演进,需持续更新应对方案。
2025-07-27 14:53:00
914
原创 Hook技术
本文介绍了多种JavaScript Hook技术实现方式,主要包括: 油猴脚本注入(Tampermonkey)- 最常用的网页脚本管理工具,支持函数覆盖、网络请求拦截等Hook技术,可通过元数据控制注入时机和权限 开发者工具Console/Snippet - 适合临时调试 书签栏注入 - 简单快捷但需手动触发 浏览器扩展开发 - 适合长期自动注入 代理工具 - 可全局修改请求响应 本地Hosts劫持 - 开发环境模拟 移动端Frida - 原生应用Hook 重点说明了油猴脚本的安装使用、常见Hook方法(函
2025-07-24 17:59:55
1601
原创 不使用油猴脚本注入 Hook 代码的方法
网页Hook代码注入方法总结:1.开发者工具 - Console直接执行(临时调试)或使用Snippets(可保存);2.书签栏注入(Bookmarklet) - 点击书签执行JS代码;3.浏览器扩展 - 开发简单插件实现自动注入;4.代理工具 - 通过Mitmproxy等中间人工具修改响应;5.Hosts劫持 - 结合本地服务器返回修改后的HTML;6.移动端 - 使用Frida框架Hook应用请求。各种方法在持久性、自动化程度和适用范围上各有特点,可根据具体需求选择。
2025-07-24 17:56:02
652
原创 在油猴脚本中注入 Hook 代码的方法
油猴脚本Hook技术指南 Hook技术是油猴脚本实现高级功能的关键,主要用于拦截和修改网页原有JavaScript行为。摘要介绍5种常用方法:1)直接覆盖函数,适用于alert等简单函数;2)劫持XMLHttpRequest/Fetch拦截网络请求;3)使用MutationObserver监听DOM变化,适用于动态加载内容;4)引入外部库辅助复杂Hook;5)定时检测简单但低效。使用时需注意注入时机(@run-at)、避免递归、兼容性等问题,示例演示了如何Hook控制台日志。通过合理选择Hook方式,可实现
2025-07-21 13:39:01
740
原创 油猴(Tampermonkey)脚本安装与使用技巧:从入门到进阶
油猴(Tampermonkey)是一款强大的浏览器脚本管理器,支持Chrome、Firefox等主流浏览器。安装后可从GreasyFork等平台获取实用脚本,或自行编写JavaScript代码来增强网页功能。主要功能包括管理脚本、调试代码、设置元数据指令,以及实现跨域请求、数据存储等高级操作。常见应用包括解除网页限制、广告拦截、自动填表等。通过掌握脚本安装和编写技巧,用户可以显著提升浏览体验。安装简单,只需在浏览器扩展商店搜索添加即可开始使用。
2025-07-21 11:24:14
4734
原创 JavaScript逆向工程:小红书X-s参数生成机制深度解析
本文深入分析了小红书Web端X-s参数的加密机制与逆向工程实现方案。X-s作为核心安全校验参数,通过MD5哈希、设备指纹和多轮加密确保请求合法性。研究采用JavaScript环境模拟和对象监控技术,完整还原了包括请求构造、Base64编码、UTF-8转换等关键流程。针对加密函数mnsv2进行了逆向分析,并提供了包含环境搭建、代码实现的完整解决方案。方案需应对环境检测、频率限制等反爬机制,适用于合规的数据分析场景。文末强调该技术仅限合法研究用途,需严格遵守相关法律法规。
2025-07-16 17:06:14
1385
3
原创 FireCrawl 本地部署完整指南:打造你自己的网页爬取服务
《FireCrawl本地部署与使用指南》摘要:本文详细介绍了开源网页爬取工具FireCrawl的本地部署方法。从系统准备(需Node.js16+)、代码克隆、环境配置(包括API密钥设置和数据库选项),到服务启动和基本爬取操作(单个页面/整站抓取)。还涵盖高级功能如自定义爬取规则、Docker部署方案、常见问题解决(如反爬策略应对)以及性能优化建议。强调需注意API密钥保护、遵守robots.txt规则等安全事项。通过本地部署FireCrawl,用户可获得完全可控的网页结构化数据采集能力。
2025-06-23 22:33:03
4465
原创 Crawl4AI项目Docker部署环境变量配置指南
本文介绍了使用Docker部署Crawl4AI爬虫框架的完整指南。主要内容包括:1) Docker部署的优势,如环境一致性、依赖管理等;2) 详细部署步骤:克隆项目、创建Dockerfile、配置环境变量文件(.env)、构建镜像和运行容器;3) 环境变量配置的最佳实践,包括敏感信息管理;4) 常见问题解决方案。通过Docker容器化部署,可简化Crawl4AI在不同环境中的配置管理,确保项目运行的一致性和高效性。
2025-05-29 15:59:28
1532
原创 Crawl4AI:高效的AI数据抓取工具
Crawl4AI是一个专为AI应用设计的开源Python网络爬虫框架,旨在高效抓取、清洗和存储网页数据,为机器学习和深度学习任务提供高质量的训练数据。该框架支持结构化和非结构化数据的抓取,包括文本、图片和视频等,并具备多线程和异步技术,确保快速且不影响服务器性能。Crawl4AI还提供数据清洗功能,自动处理重复数据和缺失值,并支持自定义扩展和AI集成,适用于文本分析、自然语言处理和图像识别等多种任务。其反爬虫机制和分布式爬虫功能进一步增强了其应对复杂抓取任务的能力。Crawl4AI以其易用性和灵活性,成为数
2025-05-22 14:37:59
1804
原创 使用 n8n 实现你的第一个爬虫程序:从零到自动化
(Web Scraping)是获取和分析数据的重要方式之一。传统爬虫需要编写代码(如 Python + Scrapy),但如果你不想折腾代码,又想快速实现爬虫功能,)抓取名言数据,并保存为结构化格式(如 JSON 或 CSV)。,可以轻松搭建爬虫工作流,甚至能自动存储、清洗和转换数据。测试,你应该能看到网页的 HTML 内容。如果想爬取多页数据,可以使用。,只需拖拽节点即可完成数据抓取。即可进入 n8n 面板。在这篇教程中,我将带你。,你应该能看到结构化数据。如果你遇到问题,欢迎在。在当今数据驱动的时代,
2025-04-25 17:11:38
4303
4
原创 在本地部署n8n:完整指南
n8n(发音为"n-eight-n")是一个开源的工作流自动化工具,类似于Zapier或Make(原Integromat),但具有更高的灵活性和自定义能力。它允许你通过可视化界面创建复杂的工作流,连接各种应用程序和服务。
2025-04-24 13:35:42
10606
原创 深度对比评测:n8n vs Coze(扣子) vs Dify - 自动化工作流工具全解析
n8n是一款开源的自动化工作流工具,采用节点式(node-based)可视化编程方式。
2025-04-24 13:24:36
2891
原创 Ngrok 完全指南:内网穿透、反向代理与本地服务暴露
隧道,并提供了丰富的管理功能,适用于开发调试、Webhook 测试、API 演示等场景。:随机 URL,每次重启变化,限制并发连接数。)暴露到公网,生成一个可访问的 URL(如。– 无需公网 IP 即可暴露本地服务。:固定域名、更多并发、TCP 支持等。– HTTP、TCP、TLS 等。– 自动提供 TLS 加密链接。注册 Ngrok 账号,获取。✅ 支持 IP 限制、密码保护。Ngrok 是一个强大的。,能够将本地服务器(如。→ 访问它等同于访问。即可访问你的本地服务!– 可绑定自己的域名。
2025-04-22 13:57:42
436
原创 在Cursor编辑器上部署MCP(Minecraft Coder Pack)完整指南
MCP(Minecraft Coder Pack)是用于反编译和修改Minecraft Java版代码的工具包。// 文件:src/minecraft/net/minecraft/entity/player/EntityPlayer.java。结合Cursor的智能功能,你可以更高效地探索Minecraft的代码世界!(匹配你的Minecraft版本,如MCP 9.40 for MC 1.12.2)中配置和运行MCP,以便高效地进行Minecraft模组开发或代码研究。或直接下载对应版本的MCP包(如。
2025-04-21 17:01:06
3262
原创 MCP(Minecraft Coder Pack)完全指南:从入门到精通
Minecraft Coder Pack(简称MCP)是一套用于反编译、修改和重新编译Minecraft Java版源代码的工具集。它允许开发者深入研究Minecraft的底层代码,并在此基础上进行模组(Mod)开发、代码分析或自定义修改。:由于Mojang官方逐步开放映射(Mojang Mappings),MCP的重要性下降,但仍在某些场景下使用。// 在 net/minecraft/entity/player/EntityPlayer.java 中。目录,修改反编译后的Java代码。
2025-04-21 16:57:33
2726
原创 如何配置微信开发者工具:完整教程
微信开发者工具是由腾讯公司官方提供的开发环境,用于开发和调试微信小程序。它支持小程序代码的编写、预览、调试、以及上线前的模拟测试。通过该工具,你可以轻松进行小程序的开发和测试,提升开发效率。通过本教程,你已经学会了如何安装和配置微信开发者工具,创建并开发一个简单的小程序项目。微信开发者工具提供了丰富的调试功能,使得开发者能够高效地调试、测试、预览和发布小程序。希望你通过本文学到如何开始使用微信开发者工具并顺利地进行小程序开发。如果你遇到任何问题,欢迎在评论区留言或查阅官方文档。
2025-04-18 14:01:34
958
原创 在PyCharm中部署AI模型的完整指南
在PyCharm中部署AI模型是一个系统性的过程,从环境设置到模型开发,再到API创建和最终部署。PyCharm提供的强大工具集可以显著提高开发效率和质量。随着实践的深入,你可以探索更多高级功能,如集成测试、持续集成/持续部署(CI/CD)等,以构建更加健壮的AI应用系统。希望本指南能帮助你在PyCharm中顺利部署AI模型!如果你遇到任何问题,PyCharm的官方文档和社区论坛都是极好的资源。
2025-04-18 13:48:29
1395
计算机求职笔试指南:涵盖软件开发、数据分析、前后端开发的技术要点与备考建议
2025-04-01
计算机行业求职指南:涵盖各方向技能要求与面试技巧
2025-04-01
知识领域:音乐技术关键词:爬虫内容关键词:音频用途:娱乐(仅供学习使用,后果概不负责)
2024-12-26
钞票鉴定数据集:基于机器学习与图像识别技术的票面真伪检测与分类资源
2025-02-13
WebDev-Django-UserAuthentication-Development
2025-02-13
前端开发中的HTML与CSS技术打造动态红色爱心网页展示
2025-02-10
Django全栈开发高级实战项目 知识领域:编程 技术关键词:Django, 全栈开发 内容关键词:实战项目 用途:学习
2024-12-26
Django全栈开发高级实战项目 知识领域:编程 技术关键词:Django, 全栈开发 内容关键词:实战项目 用途:学习
2024-12-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅