心动啊121-CSDN博客

原创大模型的基础相关概念

技术领域解决的根本问题实现的商业价值比喻压缩技术“装不下”问题降低部署门槛，让模型能在现有硬件上运行给大象瘦身，让它能进普通房间高效架构“算不动”问题突破计算复杂度限制，处理更复杂任务重新设计大象的骨骼，让它更高效移动推理优化“用不起”问题降低服务成本，实现高并发低延迟优化大象的工作流程，让它服务更多人。

2026-01-26 15:00:14 917

Python的logging模块其核心组件包括Logger（记录器）、Handler（处理器）、Formatter（格式化器）和Filter（过滤器），通过灵活组合可实现精确的日志控制。在生产环境中，建议采用标准化配置，包括：JSON格式化输出、日志文件轮转、敏感信息过滤、请求上下文管理等功能。通过logging.config.dictConfig可实现集中配置，支持多处理器（控制台/文件/日志系统）和多日志器（应用/数据库/审计）的差异化设置，满足不同场景需求，同时确保日志的安全性和可追溯性。

2026-01-22 18:44:32 312

原创 SQLAlchemy 的使用

SQLAlchemy是Python中强大的SQL工具包和ORM框架，分为Core（SQL核心层）和ORM（对象关系映射）两部分。Core适合需要精细控制SQL的场景，ORM则通过面向对象方式简化数据库操作。主要特性包括：统一数据库接口、关系处理、连接池管理、事务安全和异步支持。使用流程包括：1）配置数据库连接和引擎；2）定义模型基类和业务模型；3）创建会话工厂管理数据库会话；4）实现业务操作如增删改查；5）通过Alembic进行数据库迁移管理。SQLAlchemy能显著提升开发效率，使代码更易维护。

2026-01-22 11:27:08 1144

原创简单了解下音频和VAD（声音活动检测）

本文介绍了数字音频的基本原理和三种语音活动检测(VAD)方法。数字音频通过采样率、位深度和声道数三个关键参数将模拟信号转换为数字信号，文中演示了使用Python生成单声道和双声道正弦波音频的方法。针对语音检测，对比了WebRTC VAD、SpeechBrain VAD和Silero VAD三种方案：WebRTC VAD轻量快速但需手动处理，SpeechBrain VAD准确率高但资源占用大，Silero VAD则提供了灵活的使用方式和现代化接口。每种方案各具特点，可根据实际需求在准确性、资源占用和易用性之间

2026-01-09 13:35:35 474

原创 celery结合rabbit的简单使用

Celery是一个分布式异步任务队列系统，核心使用流程分为三个步骤：初始化配置、创建任务和调用任务。首先通过Celery类初始化应用并配置消息代理（如RabbitMQ），然后使用@app.task装饰器定义异步任务，支持重试机制、超时设置等参数。任务创建后，可通过delay()或apply_async()方法异步调用，任务会在后台执行。系统还支持定时任务和优先级队列，通过任务ID可监控执行状态和结果。典型应用场景包括邮件发送、批量处理等耗时操作，能有效提升系统响应速度。

2026-01-08 10:00:00 1665 1

原创了解ASR(自动语音识别)和模型Whisper

现代端到端ASR系统采用音频→预处理→神经网络编码→解码→文本的架构。主流技术包括特征提取（MFCC、Mel频谱）、神经网络编码（如Conformer）和解码（CTC/Attention/Transformer）。Whisper作为开源ASR模型，具有多语言支持、强鲁棒性等特点，其生态系统包含多种优化版本（faster-whisper、whisperX等）。系统输出包含文本、时间戳、置信度等信息，并通过后处理提升准确率。不同实现方案在返回结构、处理速度和功能扩展上各有特点，满足不同场景需求。

2026-01-05 18:30:00 1394

原创 FFMPeg在Python中的使用

Python调用FFmpeg的两种方式：1)通过subprocess直接调用命令行工具，实现视频转码、分辨率调整、音频提取等功能；2)使用ffmpeg-python和MoviePy库，前者提供链式语法实现复杂滤镜处理，后者面向对象设计支持高级视频编辑。ffmpeg-python适合精确控制FFmpeg参数和高性能处理，MoviePy更适合快速原型开发和复杂时间线编辑。两种方式都基于FFmpeg核心功能，但封装层级和适用场景不同。

2026-01-05 08:00:00 760

原创简单了解ES的核心概念

Elasticsearch是一个分布式JSON文档数据库，专注于高效搜索和分析。其核心架构包括：集群（多节点集合）、分片（数据水平分割）、索引（文档集合）和映射（字段类型定义）。ES采用倒排索引和近实时搜索技术，支持动态和显式映射。分析器处理文本数据为可搜索格式，查询分为叶子查询（字段匹配）和复合查询（逻辑组合）。通过分布式架构，ES能并行处理海量数据，提供高可用性和负载均衡能力。

2025-12-25 09:00:00 1294

原创负载均衡 + Nginx的基本使用

摘要负载均衡是通过将网络流量分配到多个服务器来优化资源使用、提高系统性能和可靠性的技术。Nginx作为反向代理服务器，通过upstream模块实现负载均衡，支持轮询、加权轮询、最少连接等多种调度算法，并提供健康检查、会话保持等关键机制。Nginx配置灵活，能实现IP哈希、URL哈希等会话保持方式，并支持被动/主动健康检查。负载均衡技术可有效避免单点故障，提高系统扩展性，是构建高可用架构的重要组件。

2025-12-19 13:48:52 806

原创了解JWT

JWT是一种用于安全传输信息的开放标准，由Header、Payload和Signature三部分组成。它具有无状态特性，适合分布式系统，通过数字签名确保数据完整性。JWT支持多种签名算法，采用双令牌模式实现令牌刷新，并通过黑名单等方式处理令牌吊销。使用时需注意安全防护措施，如防范篡改攻击、重放攻击等。在Python中可通过jwt库进行编码和解码操作。JWT广泛应用于身份验证和授权场景，但需合理管理密钥并避免存储敏感信息。

2025-12-17 13:41:42 664

原创 MySQL在python中的使用——连接方式及对对象的调用

本文介绍了三种Python连接MySQL数据库的方式及其特性：1) mysql-connector-python（Oracle官方支持，中等性能）；2) PyMySQL（纯Python实现，适合简单项目）；3) mysqlclient（C扩展实现，高性能但安装复杂）。文章详细比较了三者在官方支持、性能、安装难度等方面的差异，并提供了每种方式的连接代码示例。此外，还介绍了数据库连接对象和游标的使用方法，包括连接属性、不同类型游标的适用场景以及核心操作方法，最后给出了具体的CRUD操作示例代码。

2025-12-16 16:25:59 689

原创简单学下chromaDB

摘要：ChromaDB是一个轻量级向量数据库，支持高效存储和检索文本、图像等数据的向量化表示。它提供两种使用方式：1）本地持久化模式，通过PersistentClient直接连接本地数据库；2）客户端-服务器模式，通过HttpClient连接远程服务。两种方式都支持创建集合、添加文档（自动生成向量）和相似性查询。服务器模式更适合生产环境，支持自定义嵌入模型和复杂查询过滤（基于元数据和文档内容）。本地模式适合快速开发和测试，数据保存在指定目录。

2025-12-10 15:42:47 669

原创简单学下各种文件读取操作并转化成Document

本文介绍了Python处理三种常见文档格式的方法：1）使用pypdf库读取PDF文件，包括获取文档信息、提取文本内容和遍历页面；2）通过python-docx库解析Word文档结构，包括Document、Paragraph、Run和Table对象的操作；3）利用内置open()函数读取纯文本文件，支持多种编码格式。文章详细说明了各格式的核心对象属性和常用方法，为文档处理提供了实用代码示例。

2025-12-10 14:06:46 590

原创简单学习下redis

知道redis是什么，人们常常叫它为缓存数据库，简单来讲这个就是一个存储键值对的数据库。使用redis的时候，首先，要保证自己的电脑上存在redis服务，也就是安装过redis软件。或者说使用docker下载过镜像文件也是可以的，本人使用的是docker中的redis镜像。其次，在python环境中安装redis（这个redis是客户端启动程序，作用是让python能够连接到Redis服务器中）

2025-12-10 09:58:10 299

原创安装的是redis新版本，但导入的时候一直显示是旧版本

摘要：本文介绍了解决Python Redis包版本冲突的方法。首先通过grep命令定位错误文件，发现存在非官方源安装的修改版或旧版本残留。解决方案包括：1)强制卸载redis包并删除残留文件；2)清理pip缓存；3)从官方PyPI源重新安装指定版本(7.0.0)。随后提供了验证代码，检查Redis导入和连接功能是否正常，并包含一个测试脚本示例，演示如何存储和读取JSON格式数据。整个过程强调要确保使用正确的安装源和环境。

2025-12-09 15:48:24 288

原创 TensorFlow的主要应用——自定义模型和训练算法

本文介绍了在TensorFlow中自定义损失函数、指标、层和训练循环的方法。主要内容包括：1）针对含噪声数据，使用Huber损失替代MSE/MAE的实现方式；2）保存和加载包含自定义组件的模型时的注意事项；3）自定义激活函数、初始化器、正则化器和约束的方法；4）流式指标的正确实现方式；5）通过继承Layer类创建自定义层；6）使用Model类构建复杂模型架构；7）基于模型内部数据的自定义损失和指标；8）自动微分计算梯度；9）灵活的自定义训练循环实现。

2025-11-26 15:28:33 600

原创 Git\python复习

本文摘要：文章系统介绍了Git版本控制系统和Python编程语言的核心知识。Git部分详细讲解了仓库、工作区、暂存区、提交、分支等基本概念，以及常用命令如init、add、commit、merge等的使用方法。Python部分全面涵盖了数据类型（数值、序列、集合、字典）、函数参数传递、作用域规则、迭代器与生成器、异常处理、类与对象（包括继承、多态、装饰器等高级特性）、文件操作、日期时间处理以及多线程编程等内容。文章内容详实，既适合初学者系统学习，也可作为有经验开发者的参考手册。

2025-11-26 11:00:00 875

原创 numpy和pandas中的方法

本文总结了NumPy和Pandas两个Python数据分析库的核心功能。NumPy部分包括：数组创建方法（zeros/ones/arange等）、数组属性（shape/ndim/dtype等）、数组操作（reshape/concatenate/split等）、数学运算（基本运算/统计/线性代数）、广播机制和文件操作。Pandas部分涵盖：数据读写（CSV/Excel/JSON）、数据查看（head/info/describe）、数据选择（loc/iloc/布尔索引）、数据清洗（缺失值/重复值处理）、字符串操

2025-11-23 15:03:11 341

原创 Pandas12（时间序列2）—— 日期、周期、频率转换重采样和移动窗口

本文介绍了pandas中处理时间序列的核心功能，包括日期范围生成、频率设置和移位操作。主要内容包括：1)使用pd.date_range()生成固定频率的日期范围，支持多种参数配置；2)通过DateOffset和频率字符串设置时间偏移量；3)使用shift()方法进行时间序列数据移位；4)Period类表示时间段及其算术运算；5)通过to_period()和asfreq()实现不同频率间的转换。这些功能为时间序列分析提供了灵活的操作方法，支持从日到年等多种频率处理需求。

2025-11-23 15:02:59 644

原创使用Torch结合模型进行训练的整体流程

本文详细介绍了深度学习项目全流程的实现方法。主要内容包括：1) 数据准备阶段，通过标准化目录结构和分层抽样划分数据集；2) 模型配置，采用动态类或EasyDict管理超参数；3) 模型训练核心，包括自定义Dataset类实现数据加载、封装Trainer类管理训练过程，以及主训练脚本实现训练流程控制；4) 模型评估，通过准确率、混淆矩阵和分类报告等多维度评估模型性能。文章强调工程化实践，如GPU优先、验证集模型保存、学习率动态调整等核心技巧，为深度学习项目开发提供系统指导。

2025-11-22 09:00:00 885

原创 Tensorflow循环神经网络RNN

循环神经网络（RNN）是处理序列数据的专用神经网络，能够捕捉数据中的时间依赖关系。摘要介绍了RNN的基本原理、记忆单元和循环层结构，以及LSTM、GRU等改进单元。重点探讨了RNN在时间序列预测中的应用，包括数据准备、不同模型架构（如简单RNN、深度RNN）的实现和评估。通过案例分析展示了RNN处理单变量和多变量时间序列的能力，以及序列到序列模型的预测优势。

2025-10-12 15:22:54 1268 2

原创 TensorFlow卷积层2

本文介绍了四种经典CNN架构及其应用：1. LeNet-5：首个成功应用的CNN，用于手写数字识别，采用卷积+池化交替结构。2. GoogLeNet：引入Inception模块并行处理不同尺度特征，使用辅助分类器解决梯度消失。3. ResNet：通过残差连接解决深度网络退化问题，支持超深层网络训练。4. MobileNet：采用深度可分离卷积实现轻量化，适用于移动设备。文章还讲解了如何使用Keras预训练模型进行迁移学习、图像分类定位技术，以及目标检测方法如YOLO系列及其评估指标mAP。

2025-10-11 09:00:00 1492

原创 tensorflow卷积层1——卷积和池化

卷积神经网络（CNN）是处理图像、语音等数据的核心架构，其核心组件是卷积层和池化层。卷积层通过滤波器提取局部特征，支持图像分类、目标检测等任务，具有参数共享特性，能有效减少计算量。池化层通过下采样降低维度并增强特征不变性。典型CNN架构通过堆叠卷积层和池化层，逐步提取高阶特征，最后连接全连接层进行分类。训练过程中需注意内存优化，如减小批量大小或使用16位浮点数。常见的CNN模型包括LeNet-5、AlexNet等，它们在深度和结构上各有特点，推动计算机视觉发展。

2025-09-24 16:47:18 1092

原创 tensorflow加载和预处理数据

数据加载：针对中小型数据集可直接内存加载，大型数据集推荐使用tf.data.Dataset API构建高效数据管道数据预处理：使用Keras预处理层（如Normalization/Discretization/Embedding等）图像处理（Resizing/Rescaling/数据增强）文本处理（TextVectorization） TFRecord文件格式：详细说明如何创建和读取TFRecord，包括Example和SequenceExample的使用性能优化技巧：如map并行处理。tfhub

2025-09-24 16:45:02 1188

原创 Tensorflow基础——数据类型、计算图

TensorFlow是一个基于计算图的深度学习框架，其核心数据结构是张量（多维数组），支持GPU加速和分布式计算。TensorFlow通过计算图优化计算效率，实现自动微分和跨平台部署。张量与NumPy数组类似，但支持硬件加速和自动求导。数据类型转换需显式操作，变量（tf.Variable）用于存储可修改的权重。TensorFlow提供丰富的张量操作（如reduce、数学运算等），并能与NumPy互转。tf.function将Python函数编译为计算图以提高性能，需注意避免副作用和外部库调用。TensorF

2025-09-22 18:49:45 1042

原创深度神经网络2——优化器选择、学习率消毒、正则化选择

for name in sorted(dir(tf.keras.optimizers.schedules)): # dir返回方法内对象的所有内置方法continuescheduler_class = getattr(tf.keras.optimizers.schedules, name) # python的反射机制，通过字符串获取属性或方法print(f"• {name} – {scheduler_class.__doc__.splitlines()[0]}") # 根据换行符进行分割，并取第一行。

2025-09-13 16:02:23 960 1

原创深度神经网络1——梯度问题+标签数不够问题

摘要：深度神经网络训练中常面临梯度消失/爆炸、数据不足、过拟合等问题。解决梯度问题可通过权重初始化（Xavier/He）、激活函数优化（ReLU变体、SELU）和批量归一化（BN），其中BN还能加速训练并缓解过拟合。梯度裁剪可限制梯度大小，确保稳定更新。数据不足时，采用迁移学习重用预训练层或无监督预训练（如自动编码器）提取通用特征。辅助任务预训练通过额外任务增强模型泛化能力。Keras中通过调整初始化器、激活函数和优化器参数（如clipnorm）实现这些技术，显著提升模型性能与训练效率。

2025-09-13 15:50:43 1017

原创神经网络2——使用Keras实现MLP

本文介绍了使用Keras构建、训练和优化神经网络的全流程。主要内容包括：1）使用顺序API构建分类MLP和回归MLP，详解模型构建、参数设置、训练评估方法；2）使用函数式API构建复杂模型，包括多输入输出模型；3）子类化API实现动态模型；4）模型保存与恢复、检查点回调、TensorBoard可视化；5）超参数调优方法，包括隐藏层数量、神经元数量、学习率等关键参数的优化策略；6）Keras常用层详解。文章提供了从基础到进阶的完整神经网络开发指南，涵盖模型构建、训练优化和部署全流程，适合深度学习开发者参考。

2025-09-01 10:57:03 721

原创神经网络1——sklearn的简单实现

神经网络是一种由多层参数化、可微分函数组成的计算模型，是深度学习的核心。它经历了多次兴衰，从1943年MP模型的提出，到1980年代BP算法的出现，再到2010年后因大数据、强算力和新算法的突破迎来深度学习的革命。神经网络能解决图像分类、语音识别等复杂任务，其架构包括单层感知机（解决线性问题）和多层感知机（解决非线性问题）。通过反向传播算法优化权重，配合激活函数（如Sigmoid、ReLU）实现梯度计算。Scikit-Learn提供的MLPRegressor和MLPClassifier分别适用于回归和分类

2025-09-01 10:46:57 1333

原创随机森林2——集成学习的发展

本文系统介绍了机器学习中特征重要性和多种集成学习方法。特征重要性通过计算特征对预测结果的贡献程度，帮助优化模型，包括基于树模型的内置方法和线性模型系数两种计算方式。集成学习方法部分详细讲解了提升法（Boosting）及其代表性算法AdaBoost和梯度提升（Gradient Boosting）的工作原理，以及基于直方图的梯度提升（HistGradientBoosting）的优化技术。此外，还介绍了堆叠法（Stacking）和极限梯度提升（XGBoost）的实现原理和应用场景。

2025-08-23 16:50:52 1074

原创随机森林1

集成学习通过组合多个预测器（分类器或回归器）来提高预测准确率，即使单个预测器是弱学习器，集成后也能形成强学习器。主要包括硬投票（基于类别标签）和软投票（基于概率加权）两种方式。随机森林是典型的集成方法，通过数据随机采样（bagging/pasting）和特征随机采样增加多样性，降低方差。极端随机森林进一步引入随机分裂阈值，以更高偏差换取更低方差。实验表明，集成方法通常优于单一模型，关键参数需通过交叉验证优化。

2025-08-23 16:49:27 1182

原创决策树

决策树是一种强大的机器学习算法，可用于分类和回归任务。其核心是通过递归分割数据，构建树状结构进行预测。决策树的优势在于无需数据预处理，计算复杂度低（预测仅需O(log2(m))）。算法使用基尼系数或熵衡量节点纯度，通过CART算法寻找最优分割特征和阈值。为避免过拟合，可通过max_depth、min_samples_split等参数进行正则化。决策树对数据方向敏感，可能产生高方差模型。在分类任务中，它通过信息增益选择最优分割特征；在回归任务中，则通过最小化MSE进行预测。

2025-08-22 11:13:25 863

原创支持向量机

支持向量机（SVM）是一种强大的机器学习模型，适用于分类、回归和异常检测任务。其核心思想是通过寻找最优决策边界（超平面）来最大化不同类别之间的间隔。SVM包括线性分类（硬间隔和软间隔）和非线性分类（通过核函数映射到高维空间）。线性SVM对特征缩放敏感，且训练结果仅由支持向量决定。非线性SVM常用多项式核、RBF核和Sigmoid核等核函数处理复杂数据。SVM回归通过调整目标使样本尽可能落在边界内，并用超参数ε控制街道宽度。对偶问题和梯度下降方法可用于优化SVM的求解过程。

2025-08-22 11:11:17 765

原创 sklearn分类和评估分数选择

本文介绍了scikit-learn中分类任务的核心内容。第一部分概述了sklearn.datasets模块，包括内置数据集、远程数据集和生成数据集的方法。第二部分详细讲解了分类原理，包括二分类和多分类的实现方式，以及常用算法（如逻辑回归、SVM、随机森林等）的关键参数设置。第三部分重点阐述了分类评估指标的选择策略，针对不同场景（平衡/不平衡数据、二分类/多分类）推荐了合适的评估方法（准确率、F1-score、AUC等），并提供了指标计算公式和适用场景分析。全文系统性地介绍了从数据准备到模型评估的完整分类流程

2025-08-17 13:11:47 706

空空如也

空空如也