自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Kida 的躺平小屋

您也可以在 51CTO、掘金和知乎关注我的同名博客哦!

  • 博客(260)
  • 资源 (33)
  • 收藏
  • 关注

原创 【从零开始】19. 模型实测与验证

在真正开讲之前需要补充一下“16. 基于 CPU 的转换、量化实现”和“18. 持续优化模型微调”中遗漏的信息。

2025-12-05 11:18:11 925

原创 【从零开始】18. 持续优化模型微调

有小伙伴私信说希望能展开说说如何做模型持续优化,为此临时加开一章,讲讲如何结合 brain-mix 项目的 Unsloth 微调报告进行训练结果分析。首先我们在超参数不变的前提下做三轮训练,每次训练只增加训练数据,看看三轮下来的效果如何。通过损失率(Loss)稳定下降得知,当前模型处于“欠拟合”或者说学习不足的状态。这意味着模型的容量(由 LoRA 参数的 r 决定)可以学习更复杂的模式,但它还没有“看”到足够多的数据来充分学习。简单来说就是模型当前还“学有余力”,但我提供的“学习资料”不足。

2025-11-06 11:10:06 844

原创 【从零开始】17. 中文摘要提取工具

答:Maximal Marginal Relevance (MMR),最大边缘相关性算法。简单来说使用 MMR 的最终目的是为了选出 k 个句子,使得这些句子既与原文主题相关,但又彼此之间不重复。

2025-10-30 11:48:09 735

原创 【以太来袭】2. 节点设计与部署

在实际开始之前,要先决定好要用哪种共识机制。那个时候用的是 Besu 的 22.4 版本。本次 Besu 使用的是 25 版本,经过这么几个大版本升级之后原有的问题应该已经修复了吧…那么本次我们就还是先试试 QBFT 吧。话又说回来,为什么我对 QBFT 共识那么执着呢?那么事不宜迟,我们马上开始吧。

2025-10-22 16:13:11 1006

原创 【Java】基于 Tabula 的 PDF 合并单元格内容提取

而 Tabula 的 SpreadsheetExtractionAlgorithm 算法是处理这种问题的最佳起点,但它提取的结果会是“不规则”的,即每行的单元格数量可能不同。因此本次将采用后处理的方式进行解析,Tabula 更多的只是作内容提取,表格组织还是在后期处理进行的。本次解决问题的核心思路就是通过计算每一个单元格完整的边界框,得到它的 top,left, bottom,right。同理,通过收集所有单元格的 left 坐标和 right 坐标,可以推断出所有“真实”的列边界。”章节里面的那个表格。

2025-10-21 14:42:57 593

原创 【从零开始】16. 基于 CPU 的转换、量化实现

不过这次的 OpenVINO 量化方案我会选择 “OpenVINO IR + IR 量化” 这种方式来实现,前期先以 Weight-only 做 INT4 权重量化,后续还会将其优化成 PTQ 模式,添加 calibration_dataset 做激活校准。没有样本数据,框架就无法知道激活值的实际分布范围。所以,校准数据的目的,是“观察”模型在真实输入下的激活统计,从而避免量化后溢出或精度崩坏。站在我们真实的场景中,QAT 需要重新训练,而且需要全量的训练数据,因此并不适合我们,我才使用 PTQ 的。

2025-10-13 14:06:41 723

原创 【以太来袭】1. 企业以太坊回归

而 Fabric 引入了许多独特的、复杂的概念,如通道 (Channels)、锚定节点 (Anchor Peers)、背书策略 (Endorsement Policies)、成员服务提供者 (MSP) 等,学习曲线非常陡峭。而部署一个生产级的 Fabric 网络,则需要配置 Orderer 节点、Peer 节点、CA (证书颁发机构)、MSP,并定义复杂的通道和背书策略,整个过程涉及的组件和配置文件要多得多,运维也更复杂。而 Fabric 虽为实现复杂的背书策略提供了可能,但也增加了系统的复杂性。

2025-09-26 13:36:58 345

原创 【从零开始】15. “小”模型微调

指标最小值最大值平均值标准差验证集损失2.02372.58822.09950.1262训练集损失1.40402.32191.92960.2101训练耗时(分钟)8.2137.937.0。

2025-09-23 14:32:08 1004

原创 【从零开始】14. 数据评分与筛选

于是最终就变成了,写个自动化脚本遍历所有问答退,并使用 3 个大模型同为一条问答对进行评分,最终取平均分为最终得分(由于大模型各自的机制不一样,若只用一种大模型进行评分未免有些偏颇,既然这样我就同时用 3 个大模型进行评分,效果要好一点)。至于后面根据平均分字段进行删除的就不再将代码贴上来了,各位有兴趣可以到我的 gitee 或者 github 仓库中查阅吧(就根据所有记录“平均分”字段汇总做一个总的平均分,低于分数线的记录直接删除就是了,没有什么可说的)。并且每个行业的情况不一样,感觉没有分享的必要了。

2025-09-14 21:18:50 543

原创 【从零开始】13. 数据增强(Data Augmentation)

书接上回,上一章我们简单地过了一遍如何获取训练数据并通过代码将数据保存到 Elasticsearch 中了,但是保存下来后发现数据量还是不够(总数据量 22w+),这个时候可以选择采用数据增强技术来补充训练数据。同理,这次我也是在 Modelscope、和鲸、飞桨、天池等多个平台获取跟中药相关的开放数据集,由于这次数据集不再是直接的问答数据而是一些内容详情,因此无法直接使用。为了方便数据整理我先按分类将数据集放入最为熟悉的 MySQL 中进行数据“初加工”。处理起来大同小异,就不再叙述了。

2025-09-12 10:52:03 1014

原创 【从零开始】12. 一切回归原点

各位新老朋友,好久不见了。距最后一次更新已有差不多一年的时间了。这期间发生了很多事儿,一度让我走进了人生低谷。现在,一切都已经过去,热爱分享、与君共勉仍是我的初心。一切都“从零开始”吧,这样也不错。言归正传,由于不可抗力的因素“番外篇”就此结束。接下来我将会以“零成本”为目标跟大家一起“搓”一个简单的中药领域 NLP 模型出来,之前未能分享给大家的,接下来将结合新优化一并公开分享。此外,由于 RTX 1060 显卡已被家人征用,因此本次分享将另辟蹊径。整条技术线将以 CPU 为推理单元完成,望周知。

2025-09-10 17:08:15 1068

原创 【从零开始】11. LLaMA-Factory 微调 Qwen 模型(番外篇)

本文将从部署开始,详细讲一下如何使用 llamafactory 对开源模型进行指令微调了,并且在微调过程中我是如何一次一次地进行参数调整的,我也跟各位分享一下。

2024-12-29 22:16:18 2010

原创 【从零开始】10. RAGChecker 提升回答准确率(番外篇)

本文讲述本人使用 RAGChecker 对 RAG 应用调优的过程,里面还会包含一些关于 RAGChecker 的使用意见,希望对各位有用~

2024-12-25 18:27:22 941

原创 【从零开始】9. RAG 应用调优-再续(番外篇)

本文将介绍在 Python 中如何对 CUDA 显存进行监控并在到达阈值时进行显存的清理,希望这个对大家也有用吧。

2024-12-13 15:55:21 515

原创 【从零开始】8. RAG 应用调优-续(番外篇)

“直线谁不会踩油门,弯道快才是真的快”这句话的含金量还在上升。

2024-12-05 09:09:39 1136

原创 【从零开始】7. RAG 应用调优(番外篇)

本文讲述如何使用 pressure_util.py 压测工具对基于 transformers 驱动的 RAG 应用进行性能调优的过程(没有用加速框架就是一些基础优化)。

2024-11-23 09:24:14 1290

原创 【从零开始】6. RAG 应用性能压测工具(番外篇)

本文主要讲述 SSE(ServerSent Event)机制,以及如何编写基于 SSE 的压力测试程序,虽然是一个浅显的 Python 实现,但对于希望远程压测的需求来说是够用了(前提是配合其他监控工具使用,因为本工具没有数据统计)。

2024-11-11 11:24:58 1290

原创 【从零开始】5. 向量数据库选型与搭建(番外篇)

本文将结合 docker 版本的 elasticsearch 8.x 给各位展示自封装的 python elasticsearch 工具类。与此同时创建今后演示需要的项目 brain-mix 到 github 库

2024-11-08 11:24:26 1709

原创 【从零开始】4. 搭建 Python 开发环境(番外篇)

主要讲述了python 开发环境的搭建工作,从 anaconda 下载安装到 vscode 插件安装,也希望能够对 python 初学者有点帮助

2024-11-05 17:34:44 1188

原创 【从零开始】3. Ollama 接入开发工具(番外篇)

本文讲述的是如何使用 twinny 将远程 Ollama 算力接入到开发工具中,极大程度释放开发人员生产力。

2024-10-27 10:24:27 1529 2

原创 【从零开始】2. Dell PowerEdge 人工智能服务搭建(番外篇)

本文属于番外篇,讲的是如何从一台服务器裸机到 完成 Ollama 和 Stable Diffusion 部署的全过程

2024-10-26 20:24:30 1341

原创 【从零开始】1. 一切从硬件升级开始

【从零开始】系列的第一篇文章,讲述了升级人工智能硬件并实际运行 Ollama 进行推理的过程。

2024-10-25 09:28:12 1189

原创 【Docker】Elasticsearch 8.12 安装与搭建

由于工作过程中硬件资源未能达到要求,现将使用 Elasticsearch 取代原 Redis + MySQL + Milvus 技术栈,在重新搭建的同时记录一下搭建过程(由于之前也分享过 Docker 版本 Elasticsearch 5.x 和 Elasticsearch 7.x 的部署方法,因此本文对分享过的内容将不再重复说明)。

2024-08-11 23:42:03 1589

原创 【Java】记录一次 JMH 性能测试与调优

本文主要通过一次公司“加解密工具”代码优化后,通过JMH进行了性能测试的案例,为大家结合代码讲解以下 JMH 的使用。

2024-07-24 09:31:41 765

原创 【Linux】Ubuntu 漏洞扫描与修复的吃瘪经历

记录一次吃瘪经历...

2024-07-15 08:22:15 2245 1

原创 【Linux】记录一起网站劫持事件

记录一次客户网站被劫持的事件

2024-07-08 10:07:58 615 1

原创 【AIGC】Mac Intel 本地 LLM 部署经验汇总(llama.cpp)

看到标题的各位都知道了。是的,终于也轮到 llama.cpp 了。先说结论,本次 llama.cpp 部署已能在 Intel 核心的 MBP 中使用 Metal GPUs 进行推理。

2024-05-20 09:37:48 1980

原创 【AIGC】Mac Intel 本地 LLM 部署经验汇总(CPU Only)

书接上文,我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型,在非 Stream 模式下需要 89 秒才完成一轮问答,响应速度实在是太慢,后续需要想办法进行优化...

2024-05-13 21:20:28 3383 1

原创 【AIGC】本地部署 ollama + open-webui

本文将记录部署过程中遇到的问题以及解决方式,希望对你有所帮助(open-webui 采用 docker 进行部署)。

2024-05-04 10:04:32 9029 6

原创 【AIGC】本地部署 ollama(gguf) 与项目整合

本文将采用 GGUF 预量化大模型结合 Ollama 对代码进行修改,给小伙伴们演示如何逐步实现非 GPU 资源的本地整合方案。

2024-04-30 09:13:04 3048

原创 【测试】Kali Linux 渗透安全学习笔记(4) - 单一服务器扫描

距离上次做 Kali Linux 分享已经相隔半年之久了,刚好需要主导公司每半年一次的本地安全加固工作,这次将简单分享自己是如何做单一服务器的扫描。

2024-04-22 09:17:42 1245 1

原创 【AIGC】本地部署通义千问 1.5 (PyTorch)

今天想分享如何从零开始在不使用第三方工具的前提下,以纯代码的方式本地部署一套大模型,相信这对于技术人员来说还是非常有用的。

2024-04-12 11:49:06 4242

原创 【AIGC】训练数据入库(Milvus)

之前的文章有写如何获取数据、如何补充数据,也有说如何对数据进行清洗、如何使用结构化数据进行训练。但好像没有说如何将训练数据“入库”。这里说的入库不是指 MySQL 数据库,而是指向量检索库 Milvus。

2024-04-09 19:13:30 2851 1

原创 【AIGC】通义千问生成问答数据集

好久没有更新跟实际应用相关的内容了(主要是因为公司知识产权问题未能立即公开,目前只能挑选一些脱敏内容与各位分享),如标题所示本期将跟大家讲一下如何通过通义千问生成问答数据集的。

2024-04-08 15:36:24 2437

原创 【AIGC】HF-Mirror 使用说明(MacOS 版)

今天这篇文章主要是记录 HF-Mirror 的使用过程,官网上提供了 Linux 和 Windows 的使用方式。本人作为 MacOS 用户也将自己的使用办法记录一下,希望能够帮助​到其他人。

2024-04-07 16:36:58 3845

原创 【AIGC】AutoKeras 进行 RNN 循环神经网络训练

本文将结合代码讲述如何使用高质量问答数据通过 AutoKeras 的 RNN 神经网络训练问答人工智能的,希望各位喜欢。

2024-02-07 18:19:09 1357

原创 【AIGC】MacOS 本地部署 Stable Diffusion

忙里偷闲在本地部署了一套 stable-diffusion 来玩玩,虽然 Mac 还是使用 CPU 来生图,但是整体效果(生成时间、生成效果)还是能够接受的,真的感觉到 AI 的实施门槛在降低,走入平常百姓家了

2024-02-06 10:52:09 1414

原创 【面试】你认为怎样才算是合理的数据库模型?

虽然问得简单,但是涉及的知识点可不是一般的多(这里面涉及到开发、管理等方面的内容)。下面我将浅谈一下自己的看法,谢谢。

2024-02-05 17:03:32 446

原创 【面试】你了解过 TOGAF 标准吗?请谈谈你的认知。

现在各种各样的企业标准实在太多了,今天将谈谈我所认知的 TOGAF 标准以及如何在中小型企业中使用 TOGAF 标准。

2024-02-02 09:22:30 706

原创 【AIGC】AutoKeras 数据清洗与简单提纯

这次主要讲一下我这边关于训练数据的一些数据清洗和提纯的思路,有不够全面的地方请各位指正。

2024-02-01 09:20:43 1170

Scrum简介文档

2016-05-11

Oracle常见问题

非常使用的Oracle常见问题总结,作者原意将自己blog中的解答整理成书方便查阅,结果受到坊间一致好评。现将好书与各位分享共勉。

2015-12-29

Java编码规范

Java编码规范 对于刚要定制规范的公司来说很实用

2016-05-12

FusionCharts+Widgets+PowerCharts+FusionMaps v3.2 全套完美破解(附教程)

FusionCharts+Widgets+PowerCharts+FusionMaps v3.2 全套完美破解(附教程)

2016-05-11

Flex基础培训-3-[组件和布局]

Flex基础培训-3-[组件和布局]

2016-05-11

flash+xml左右箭头翻页焦点图代码

Flash + Xml 实现左右箭头点击后切换图片的前端代码

2016-05-12

jQuery 幻灯片代码

jQuery 幻灯片代码

2016-05-11

jQuery 图片渐隐切换菜单功能

2016-05-11

jQuery 灯箱示例

2016-05-11

深入Java虚拟机第二版 电子书

深入Java虚拟机第二版 电子书

2016-05-11

Java2网络协议技术内幕

Java2网络协议技术内幕

2016-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除