自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

世上再无张显宗

让你看看妲己的心

  • 博客(309)
  • 收藏
  • 关注

原创 YaRN(“Yet Another RoPE extension”)——RoPE的升级版

YaRN

2025-12-11 09:34:30 799

原创 deepseek-V2完整参数配置

deepseek-v2参数配置

2025-12-02 13:42:21 215

原创 deepseekv2———MLA与解耦位置编码-详细原理解析

MLA(Multi-Head Latent Attention)完整解析:从原理到公式详解。

2025-11-11 17:47:33 987

原创 deepseek-v2之MLA(Multi-Head Latent Attention)潜在注意力机制

摘要:DeepSeek-V2的MLA(Multi-Head Latent Attention)通过KV压缩解决Transformer的KV Cache瓶颈。传统方法需缓存所有历史token的高维Key/Value向量(显存占用大),而MLA利用低秩压缩将KV映射到潜空间,仅需存储压缩后的低维向量$\mathbf{c}_t^{KV}$,显存占用减少87.5%(如$d_c=1024$时压缩比达8×)。

2025-11-10 14:55:58 1023

原创 SpeechT5 模型训练注意的事项(vocabs词典构建,语音序列压缩与扩张)

SpeechT5 模型训练注意的事项(vocabs词典构建,语音序列压缩与扩张)

2025-09-03 09:59:04 887

原创 缩放定律(Scaling Laws)

缩放定律(Scaling Laws)

2025-08-25 15:44:15 920

原创 BBPE(Byte-level BPE)子词(subword)分词算法

BBPE 分词算法详解 BBPE(Byte-level BPE)是现代大模型的核心分词技术,通过字节级编码和预分词规则解决传统BPE的局限性。其核心流程包括:将文本转为UTF-8字节序列、运行BPE算法合并高频字节对、构建词汇表。关键技术突破在于: 预分词机制 - 通过空白符分割、标点隔离和CJK字符保护,防止无意义合并 数字处理 - 用正则表达式或自定义规则强制拆分数字为单个digit 字节级编码 - 原生支持多语言、emoji和特殊符号 典型应用包括GPT系列和Llama模型,Hugging Face工

2025-08-20 14:20:58 1074

原创 大模型数据预处理

大模型数据预处理学习

2025-08-19 09:56:32 1302

原创 Could not find platform independent libraries <prefix> Consider setting $PYTHONHOME to <prefix>[:<ex

报错问题解决

2025-08-13 16:06:02 857

原创 Qwen3论文研读

qwen3论文研读

2025-07-29 14:45:01 1293 1

原创 思维预算基本概念及其预算配置

思维预算及其预算配置

2025-07-24 10:33:14 1390

原创 大模型蒸馏-在线蒸馏与离线蒸馏(1)

大模型蒸馏理论

2025-07-18 11:03:14 1096

原创 奖励黑客(Reward Hacking)

奖励黑客(Reward Hacking)

2025-07-17 17:26:50 851

原创 vannaai本地部署安装

vannai本都部署实现texttosql

2025-03-20 16:14:21 2318 1

原创 ollama本地大模型,ollama及其openai接口实现

ollama本地部署大模型接口实现

2025-03-20 15:54:10 1859

原创 论文研读0530(基于循证思维的档案文献遗产数据故事化模型构建研究)

目的/意义]对于文化产业,认知门槛低、交互体验强、记忆点鲜明的数据故事丰富了文化传承与传播路径,为唤醒集体记忆提供新媒介。但是目前数据故事化研究主要集中于故事内容的生成,忽略了对来源数据的前期控制,使得故事的可信度和完整性受到质疑。[方法/过程]引入循证思维,构建档案文献遗产的数据故事化模型,秉持可溯源循证、可信赖循证、可解释循证三项基本原则,全面搜寻事件证据,基于时空关联和语义逻辑构建事件证据链,结合多元互证方法,旨在创造更加准确的故事。

2024-05-30 17:06:49 1993

原创 AI证件照抠图

AI免费证件照证件照抠图

2024-04-08 09:48:54 615 2

转载 转postman与Pythonflask相结合接口测试

【【自动化接口测试(1)】postman与python_flask相结合,完成接口请求自动化 【建议加精收藏,真的有用!】 - CSDN App】http://t.csdnimg.cn/2h6py

2024-01-22 16:11:31 183 1

原创 数据挖掘、数据分析——异常值处理、归一化处理

数据处理

2023-05-06 16:02:30 1214

原创 np.convolve(x,h, mode=‘##‘)的使用

numpy.convolve计算方式

2023-04-28 11:23:09 2401

原创 numpy.hanning()的使用

numpy.hanning用法

2023-04-28 11:00:13 660

原创 cv2.absdiff的使用

cv语法学习

2023-04-27 15:00:04 1638

原创 cv2.COLOR_BGR2RGB、cv2.COLOR_BGR2GRAY、cv2.COLOR_BGR2HSV

python在cv的基本语法学习

2023-04-27 14:49:45 3097

原创 SG-Edge: 电力物联网可信边缘计算框架关键技术——(1)

论文分享

2023-04-13 11:13:15 1114

原创 python图片raw转换成jpg

个人笔记

2023-04-13 10:49:20 1771

原创 文本摘要生成评价指标——rouge

文本摘要生成评价指标学习

2023-03-15 16:42:51 5060 2

原创 端到端流式语音识别研究综述——语音识别(论文研读)

语音识别

2023-03-13 16:17:24 5875 2

原创 基于BERT-PGN模型的中文新闻文本自动摘要生成——文本摘要生成(论文研读)

学习记录

2023-03-06 15:13:00 5422 9

原创 改进 YOLO V5 的密集行人检测算法研究(论文研读)——目标检测

论文研读:yolov5行人目标检测

2023-03-01 15:57:18 7065 5

原创 (论文研读)A Video Key Frame Extraction Method Based on Multiview Fusion-————一种基于多视图融合的关键帧抽取方法

论文研读

2023-02-28 18:16:23 2227 1

原创 ModuleNotFoundError: No module named ‘fsspec.archive‘

解决bug

2023-02-21 16:28:24 2133

原创 cv2.imread()、cv2.putText、cv2.imwrite()、cv2.waitKey()

cv2一些基本常识。

2023-01-18 10:57:26 901

原创 python安装webrtcvad总是报错

bug解决

2023-01-17 15:32:36 1145

原创 AttributeError: module ‘ssl‘ has no attribute ‘SSLSocket‘或者OpenSSL SSL_read: Connection was rese

bug解决

2023-01-17 15:16:09 2337

原创 python统计word文档页码(pdf、doc、docx)

python统计word页码

2022-11-25 17:22:52 2852

原创 文本关键信息抽取——实体抽取代码实现

学习代码实现

2022-11-25 17:16:02 1523

原创 深度学习语法笔记(一)——loss.item() -numpy() - unsqueeze() -MSELOSS()

python一些语法使用,自学的一些笔记。

2022-11-25 17:08:20 1164

原创 文本关键信息抽取-面向复杂文本结构的实体关系联合抽取研究(论文研读)(二)

实体关系抽取论文研读

2022-11-10 11:01:41 828

原创 文本关键信息抽取-面向复杂文本结构的实体关系联合抽取研究(论文研读)(一)

论文研读

2022-11-09 17:30:45 2175

原创 AttributeError: module ‘lib‘ has no attribute ‘X509_V_FLAG_CB_ISSUER_CHECK‘

bug解决

2022-11-08 15:11:33 14519 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除