- 博客(66)
- 收藏
- 关注
原创 【DataWhale】快乐学习大模型 | 202507,Task03笔记
它让模型能够理解一个词在句子中与前面或后面的词的关联性,捕捉长距离依赖,并为每个词建立一个富含上下文信息的表示。这个加法操作的目的是为了在 Softmax 之前,将模型不应该“看到”的未来位置的注意力分数置为负无穷,从而确保 Softmax 之后这些位置的注意力权重变为 0,达到遮蔽未来信息的目的。注意力机制的本质是对两段序列的元素依次进行相似度计算,寻找出一个序列的每个元素对另一个序列的每个元素的相关度,然后基于相关度进行加权,即分配注意力。在词向量中的直观理解:假设词向量的每个维度代表词语的某种。
2025-07-18 20:24:15
949
原创 【DataWhale】快乐学习大模型 | 202507,Task02笔记
自动问答,包括检索式问答(Retrieval-based QA)、知识库问答(Knowledge-based QA)和社区问答(Community-based QA)文本摘要,即对大段落的文本进行概况,包括两种方法:直接从原文中抽取拼接组成摘要;关系抽取,这一任务主要是对文本进行理解,如因果关系、归属关系等,一般在知识图谱中应用的较多。文本分类,这是一个比较大的类,涵盖情感分析、垃圾邮件检测、新闻分类、主题识别等。实体识别,识别句子中具有特定意义的实体,如人名、地点、组织、日期、时间等。
2025-07-16 23:54:46
331
原创 ChatGLM2-6B 微调:解决 Distributed package doesn‘t have NCCL built in
解决Distributed package doesn't have NCCL built in
2023-10-27 10:29:38
636
1
原创 Aladdin Persson PyTorch Tutorials(全连接CNN,RNN,LSTM代码)
Aladdin Persson PyTorch Tutorials代码
2023-08-16 16:09:35
356
原创 软件工程过程复习
文章目录第一章软件过程基本概念说明第二章2.1 需求分析与管理2.2 设计2.3 编码2.4 软件测试2.5 运行与维护2.6 软件项目管理什么是项目?2.7 软件配置管理配置审计2.8 软件验证与确认2.9 软件质量保证2.10 软件文档管理第三章 软件生存周期模型3.1 编码修正模型3.2 瀑布模型3.3 增量模型3.4 统一过程模型第四章 协同过程模型4.1 初始阶段4.1.1 迭代一:确定事件与参与者4.1.2 迭代二:用例分析与初步建模4.1.3 迭代三:细化用例路径和准备系统初始架构4.2 细化
2022-05-06 18:44:53
728
原创 软件工程过程复习
文章目录第一章软件过程基本概念说明第二章2.1 需求分析与管理2.2 设计2.3 编码2.4 软件测试2.5 运行与维护2.6 软件项目管理什么是项目?2.7 软件配置管理2.8 软件验证与确认2.9 软件质量保证2.10 软件文档管理第三章 软件生存周期模型3.1 编码修正模型3.2 瀑布模型3.3 增量模型3.4 统一过程模型第四章 协同过程模型4.1 初始阶段4.1.1 迭代一:确定事件与参与者4.1.2 迭代二:用例分析与初步建模4.1.3 迭代三:细化用例路径和准备系统初始架构4.2 细化阶段迭代
2022-05-04 13:56:43
833
6
原创 工程经济与项目管理(个人笔记)
来源:兰州交通大学MOOC文章目录第一章 概述1.1 工程项目概述1.1.1 什么是项目1.1.2 工程项目的组成1.2 工程经济概述1.3 项目管理概述第二章 现金流量与资金时间价值2.1 现金流量和现金流量图2.2 资金的时间价值2.3 名义利率和实际利率2.3 资金的等值计算折现公式等额支付终值公式等额支付现值公式第三章 工程经济基本要素3.1 工程项目投资3.1.3 建设期利息3.2 总成本费用3.3 收入与税费3.4 利润第一章 概述1.1 工程项目概述1.1.1 什么是项目三大目标:
2022-03-25 22:02:38
3779
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人