自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(364)
  • 资源 (7)
  • 收藏
  • 关注

原创 Jason安装细节

注意事项: 1. 在1的教程中,添加系统环境变量时,端口号填多少,参考证书文件中的端口号。如我这个里面就是 27000 相应的环境变量值就要修改。安装完成后,如果仍然提示端口号不一致,试试重启。

2025-11-10 14:30:01 168

原创 Unet-初探

U-Net 是由 Ronneberger 等人在 2015 年提出的一种卷积神经网络,最早用于 医学图像分割(尤其是细胞、组织、病灶区域的分割)。它的名字来源于网络结构的形状 —— 对称的“U”形。U-Net 的设计目标是:在训练样本较少的情况下,仍然能够实现高精度的 像素级分割。

2025-10-15 18:15:54 82

原创 matlab 代码与python代码转换的细节

最近在做项目的时候,涉及到需要将matlab 代码转换为python代码,在实现过程中的踩坑和注意点记录如下:主要是索引和切片和单列向量提取后的维度不一致。此外: 一开始上来就借助AI进行了转换,后果就是结果不一致,花大量时间一行一行单步调试,对参数结果。(大哭,浪费了很多时间)matlab 提取列向量之后是二维列,python是一维, 需要将一维转成二维。AI改完,应先基于已有认知对一下代码,是否有常规的错误。

2025-10-14 17:45:47 332

原创 【项目实战】知识库——基础理论1

总资产’指公司拥有的全部资源。2. 各公司独立答案:A公司6,601,086,000元,B公司1,249,642,000元,C公司217,435,000元。=> 让比较好的大模型,给出 answer,以及评分点(基于answer,哪个是需要回答出来的,答案的维度都有哪些,每个值多少分)Step3,将 answer’ 与 answer进行比对,按照评分点进行打分,超过一定的分数则正确,否则回答不正确。如果普通项目,用rerank模型就可以,如果要求很高,可以用大模型,但是使用大模型的话,成本比较高。

2025-09-18 18:12:17 51

原创 Model Context Protocol (MCP)

什么是 MCP(Model Context Protocol)MCP 是一个由 Anthropic 在 2024 年提出的 开放标准 / 协议,目的是标准化大语言模型(LLM)与外部工具、数据源、提示(prompts)之间的交互。通俗地说,就是让 AI 应用(客户端)和提供工具/数据/上下文的服务(服务器)之间,有一个统一、安全、可组合的方式去通信。strstrstrstrstr📌 含义:mcpServers 表示 MCP 插件服务器列表“amap-maps” 是你定义的服务名。

2025-09-17 16:35:25 51

原创 【大模型应用】Function Calling与协作

import os# 定义资源文件根目录# 配置 DashScopedashscope.api_key = os.getenv('DASHSCOPE_API_KEY', '') # 从环境变量获取 API Keydashscope.timeout = 30 # 设置超时时间为 30 秒# 函数描述 描述函数的名字、用途、参数类型,这是 Function Calling 的 Schema,模型会根据它来决定是否调用函数。"description": "获取指定位置的当前天气情况",

2025-09-17 14:44:54 52

原创 【大模型】LongChain多任务应用开发

LongChain + Deepseek + Faiss 打造RAGLongChain的功能跟大模型中的 Function Call 类似。

2025-09-11 14:32:04 955

原创 【大模型07】RAG高级技术与实战

embedding 过程中,神经网络的输入=单词,输出=输出 = 单词(作为邻居)的概率Q:怎么把调用模型API改为服务器部署好的大模型,另外知识库单个文件改为文件夹现在使用的是 dashscope 接口,我们也可以部署自己的大模型,通过 http serivce,按照dashscope/openai 接口进行返回内容server填写自己的 api url即可faiss。

2025-09-09 11:49:52 976

原创 【大模型应用】06RAG embedding+LLM问答系统

ChatPDF-Faiss 是一个基于 LangChain 和 OpenAI 的 PDF 文档问答系统。该系统能够读取 PDF 文件,提取文本内容,并使用向量数据库(FAISS)构建知识库,从而实现对 PDF 文档内容的智能问答功能。系统还能够追踪回答来源的页码,提供参考信息。企业文档问答:合同、考核办法、制度文档知识库构建:PDF/文本向量化存储语义检索:快速找到相关信息问答系统:结合向量检索 + LLM 生成自然语言答案溯源能力:可追踪答案来源页码。

2025-09-05 11:17:44 60

原创 [大模型06]RAG技术与应用-理论

• 检索增强生成,是一种结合信(Generation)的技术• RAG技术通过实时检索相关文档或信息,并将其作为,从而提高生成结果的时效性和准确性。

2025-09-04 17:48:42 107

原创 显存的基本概念和比较

这张图展示了训练时 显存占用的组成部分(假设 24GB 显存):🟦 模型参数:10GB🟩 激活值 (Activations):8GB🟨 Batch 数据:4GB🟥 优化器状态:2GB。

2025-09-04 17:00:40 534

原创 【大模型微调】医疗模型微调

模型部分:加载预训练模型 + LoRA 适配器。数据部分:读取多科室 CSV,统一成 instruction/input/output,然后格式化成 prompt。训练部分:使用 SFTTrainer,配置 LoRA + mixed precision + 小 batch。推理部分:启用 FastLanguageModel.for_inference(model),使用 TextStreamer 输出生成结果。保存部分:只保存 LoRA 权重和 tokenizer。

2025-09-01 18:26:01 47

原创 【无标题】训练、推理适用的数据类型

类型位宽指数尾数优点缺点FP3232823精度高,数值稳定显存大,计算慢FP1616510显存省,计算快易溢出,需要 loss scalingBF161687数值范围大,训练稳定尾数精度低INT88推理快,显存小训练不适用INT44超低显存,速度快精度损失大。

2025-09-01 17:40:35 399

原创 【大模型】大模型微调-RLHF(强化学习)

上篇介绍了PEFT(LORA)参数微调,这篇介绍RLHF(基于人类反馈的强化学习)

2025-09-01 17:08:16 61

原创 【大模型14】Fine-tuning与大模型优化1

get_peft_model 就是把 LoRA(PEFT 方法) 加载到模型中,Unsloth 封装了整个流程。你无需手动写 LoRA 矩阵操作,也无需自己管理量化和显存优化。

2025-08-29 18:15:45 64

原创 【大模型13】 视觉大模型与多模态

Internvideo2,新型的视频基础模型(VFM),在视频识别、视频文本任务和对话任务中取得了SOTA。在数据层面,通过语义分割视频并生成视频-音频-语音字幕,优先考虑时空一致性,从而提高了视频和文本之间的对齐。)),它严格要求 image_url 必须是 公网 URL 或 file_id,所以 file:// 就报错了。可以做车辆里程表识别、车辆承保、危险驾驶行为识别、损失评估、车辆事故要素提取等。模型表现:动作识别、时间动作识别、事件技术、视觉语言导航等。模型表现:动作识别、时间动作识别、

2025-08-29 15:52:25 75

原创 混淆 打包 编译

开发完成 → 混淆代码 → 打包成 EXE → 分发给客户。目标: 把一套python 代码,打包成exe。二、混淆打包 (该步骤我没有成功,有报错)

2025-08-28 16:34:34 191

原创 【天池】资金流入流出预测

题要求阿里天池大数据的比赛: https://tianchi.aliyun.com/competition/entrance/231573/information。

2025-08-25 17:22:21 618

原创 基于周期因子的资金流入流出预测

基本思想:把时间序列拆成“基数”(长期水平/趋势)和“周期波动”两部分。周期因子用于刻画固定周期内的相对涨落(如一周内、一个月内不同天的规律),通过因子对基数进行放大/缩小来得到每天的预测。核心步骤:数据聚合:按天聚合得到每日申购、赎回总额,并构造 weekday(0-6) 与 day_of_month(1-31)。计算基数:通常取历史总体均值或平滑均值(如7日均线)作为基数。计算周期因子:weekday 因子 = 各 weekday 的历史均值 / 全局均值。

2025-08-25 17:20:43 413

原创 资金流入流出预测baseline-prophet

Prophet 是由 Facebook 开发的开源时间序列预测工具,专为处理具有季节性趋势的时间序列数据而设计。以下是 Prophet 的核心功能、高阶使用方法及其在现实场景中的应用。

2025-08-22 10:34:16 310

原创 prophet

Prophet 是由 Facebook 开发的开源时间序列预测工具,专为处理具有季节性趋势的时间序列数据而设计。以下是 Prophet 的核心功能、高阶使用方法及其在现实场景中的应用。

2025-08-21 16:26:00 82

原创 【大模型05】Embedding和向量数据库

• 下 载 地 址 : https://github.com/susanli2016/MachineLearning-with-Python/blob/master/Seattle_Hotels.csv• 字段:name, address, desc• 基于用户选择的酒店,推荐相似度高的Top10个其他酒店• 方法:计算当前酒店特征向量与整个酒店特征矩阵的余弦相似度,取相似度最大的Top-k个• 通过测量两个向量的夹角的余弦值来度量它们之间的相似性。

2025-08-04 22:41:40 104

原创 【大模型03】 Cursor 编程 从入门到精通

cursor trae codebudy 三选一。

2025-07-10 18:04:07 76

原创 【案例】二手车交易价格预测-472

天池 https://tianchi.aliyun.com/competition/entrance/231784/information目标特征工程做好之后,能同时进行 lightgbm catboost 神经网络等模型,所以尽量都转换为数值类特征。 如果仅仅是使用catboost模型,则直接保留类别类特征。使用ydata_profiling 生成数据探索报告虽然快速,但是个人还是偏向自己写代码逐步探索 是否有缺失 数据分布情况 等逐步探索加载数据查看数据大致情况发现有部分数据缺失检

2025-07-10 16:56:08 177

原创 查看dataframe 中的数据类型,如果是类别类,进行labelencoder

方法二 更精确的类别监测。方法三 简化版(常用)

2025-07-09 15:47:08 39

原创 matlab设计滤波器及导出系数python调用

G 是每一节之间的增益因子,通常在 MATLAB 中,sos = tf2sos(b, a) 生成的结构是带增益的(默认 scale = ‘none’ 或 ‘inf’)。MWSPT_NSEC = 5:表示总共包含 5 个 section,但注意:其中只有 2 个是实际的 IIR 二阶节,其余是“形式上的包装”(用于放置增益项或补零)。Python 的 scipy.signal.sosfilt 要求输入的是完整归一化好的 sos 数组,即每节的 b0 要乘以对应的增益。G是每一节之间的增益因子。

2025-06-12 18:51:59 309

原创 传递函数的sos形式

传递函数(Transfer Function)是线性时不变(LTI)系统在频域中的数学模型,描述了系统输入与输出之间的动态关系。根据不同的应用场景和数学表达需求,传递函数可以表示为多种形式。note: python 中的 sosfilt 中没有乘以增益G,如果考虑增益,要在系数上乘以增益。如果用matlab 生成了滤波器的sos 系数,如何用python调用。

2025-06-12 17:41:35 104

原创 文件名自然排序 natsorted

避免在文件名排序时出现如 10 11 排在2 前面的现象,建议使用 natsorted。

2025-06-10 18:03:35 113

原创 【大模型02】Deepseek使用和prompt工程

(1)为什么能实现成本低,计算速度快架构设计方面DeepSeek MoE架构:在推理时仅激活部分专家,避免了激活所有参数带来的计算资源浪费。ML架构:MLA通过降秩KV矩阵,减少了显存消耗。训练策略方面多token预测(MTP)目标:在训练过程中采用多token预测目标,即在每个位置上预测多个未来token,增加了训练信号的密度,提高了数据效率。混合精度训练框架:在训练中,对于占据大量计算量的通用矩阵乘法(GEMM)操作,采用FP8精度执行。

2025-05-29 09:56:44 1399

原创 【01】大模型原理与API使用

本篇目标·AIGC发展:从GPT1到GPT4·AIGC的表现与优势·AIGC的通用能力应用·大模型API使用CASE-情感分析-QwenCASE-天气Function-QwenCASE-表格提取-QwenCASE-运维事件处置-Qwen。

2025-05-26 18:30:30 763

原创 数字滤波器应用介绍

线性滤波器FIR ,会引起恒定延迟,通过补零的方式补偿非线性滤波器IIR,会引起频率相关的延迟,通过零相位延迟filtfilt补偿从信号中去除不需要的频谱时,通过滤波和补偿实现。如果需要去除的频率与采样率相差甚远,比如4kHz 与100Hz, 可通过 低通滤波->补偿->降采样–> 滤波 补偿 -->上采样还原的方法。*降采样前一定要先低通滤波为了防止混叠。

2025-05-12 18:57:46 190

原创 workbench fluent动画

计算设置-解决方案动画-新建一个,画面选择刚刚上面新建的 并设置保存类型和位置。运行计算结束后,在结果-动画-播放里查看效果。项目已经完成,主要目的是做后期展示。结果-等值线-新建一个画面。加载项目 后台-初始化。

2025-05-09 15:51:00 434

原创 ANSYS Fluent -地下市政供热管道泄漏模型-note

由图可知:管道泄漏后土壤受到热水扩散的影响,温度逐渐升高,但仿真泄漏时间只有60s,所以温度影响范围小脚。描述几何结构-更新边界 在边界类型处,针对出口 入口 上下左右 进行逐个修改。创建分析项目 组件系统-几何结构;组件系统(带fluent网格划分)区域改进 确认各个区域比如管道 泄漏处 外部区域的 region type。描述几何结构: 确认几何结构类型(流体?) 是否共享拓扑 等。添加局部尺寸 对于细小部分,比如泄漏处,添加局部尺寸。设置(主要为求解设置)求解-切换到求解模式。

2025-04-21 19:40:48 781

原创 Ansys-FLUENT-笔记1

记录下在完成 地下市政供热管道泄漏模拟 案例过程中,涉及到的部分知识。

2025-04-21 19:04:00 2241

原创 matlab-数字滤波器设计与实战

零相位响应是一种理想的滤波器特性,能够完全避免相位失真,但由于其非因果性和计算复杂度,通常只适用于离线处理或非实时系统。在实时系统中,通常需要在相位失真和延迟之间进行权衡,选择线性相位或非线性相位滤波器。

2025-04-14 11:01:55 1046

原创 自适应信号处理任务(过滤,预测,重建,分类)

【代码】自适应信号处理任务(过滤,预测,重建,分类)

2025-04-03 17:33:56 425

原创 互功率谱 cpsd

互功率谱(Cross-Power Spectral Density, CPSD)是信号处理中用于描述两个信号在频域中相关性的工具。它表示两个信号在不同频率下的功率分布及其相位关系,广泛应用于模态分析、系统辨识和信号匹配等领域。

2025-03-19 15:04:20 738

原创 互相关-信号增强

经常提到通过互相关方法进行信号增强 ,抑制噪声。为什么呢?下面是一些解释。

2025-03-19 14:47:36 212

原创 使用joblib 多线程/多进程

joblib 是一个 Python 库,用于高效的并行计算和缓存。它支持 多进程(multiprocessing) 和 多线程(multithreading),主要用于加速 CPU 密集型和 I/O 密集型任务。

2025-03-06 11:21:19 2643

原创 t检验 -python

t检验的作用是帮助我们通过样本数据来推断总体的情况,尤其在小样本数据和未知总体方差的情况下特别有用。它通过检验均值差异来判断不同实验组之间、样本与总体之间是否存在显著的统计差异,从而为决策提供依据。

2025-02-12 16:18:34 94

二手车交易价格预测 天池

二手车交易价格预测 天池

2025-07-10

python版libvsm gpu加速版资源

python版libvsm gpu加速版资源

2024-05-07

Pytorch 快速入门实战之 Fashionmnist

内涵数据集、Train.py Test.py 以及相应的说明文档。适合新手快速入门ptrorch。

2022-04-24

负荷预测(小时).rar

基于BP算法进行负荷预测。过程包括数据预处理、基于BP进行训练和测试,并将预测值与实际值进行了比较。

2020-04-24

基于机器学习进行房价预测

基于机器学习进行房价预测

2021-07-11

python编程从入门到实践-使用API

python编程从入门到实践-使用API

2020-12-30

基于随机森林的能耗预测

主要包含:1.分析特征的相关性;2.基于决策树分析特征的重要性;3.基于随机森林进行能耗预测 4.基于超参数调整优化参数

2020-12-17

数据分析-作业1.rar

本作业提供上证A股的数据1套(从提供的上海机场,宝钢股份,中国石油,中国银行4套股票数据中任意选1套)

2021-07-11

手写字符识别应用-作业4.rar

手写字符识别应用-作业4.rar

2021-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除