教育领域“知之”大模型--山东大学软件学院2024年项目实训(一)

大模型的预训练

LLM Pre-Training(大型语言模型预训练)是指在特定任务上进行微调之前,对大型语言模型进行的初始训练阶段。这个阶段的目标是通过处理大规模的语料库数据,让模型学习到语言的统计规律、语义信息和上下文关系,从而为后续的微调任务提供强大的语言理解和生成能力。

大模型的基本结构

编码器——解码器框架

前沿大语言模型结构

Encoder-Only ,Encoder-Decoder ,Decoder-Only

技术发展时间线

第一阶段:海量语料库的预训练,自回归语言模型

第二阶段:自回归模型+prompting

第三阶段:多模态数据加入

第四阶段:一般化(通用)人工智能

语言模型的发展

统计语言模型 (SLM): 基于 统计学习 方法 开发,并在 20 世纪 90 年代兴起。其基本思想是基于马尔可夫假设建立词预测模型,例如根据最近的上下文预测下一个词。
神经语言模型 (NLM):引入了词的分布式表示这一概念,并在聚合上下文特征(即分布式词向量)的条件下构建词预测函数。
预训练语言模型 (PLM) 作为早期尝试, ELMo 被提出来通过预训练一个双向 LSTM biLSTM )网络(而不是 学习固定的词表示)来捕捉上下文感知的词表示,然后根据 特定的下游任务微调biLSTM 网络。进一步,基于自注意力机制的高度并行化 Transformer 架构。

LLM涌现的能力

上下文学习:假设已经为语言模型提供了一个自然语言指令和/或几个任务演 示,它可以通过完成输入文本的单词序列的方式来为测试实例生成预期的输出,而无需额外的训练或梯度更新。
指令遵循: 通过使用自然语言描述的混合多任务数据集进行微调(称为指令微调), LLM 在未见过的以指令形式描述 的任务上表现出色 。通过指令微调, LLM 能够在 没有使用显式示例的情况下遵循新的任务指令,因此它具有更好的泛化能力。
逐步推理: 对于小型语言模型而言,通常很难解决涉及 多个推理步骤的复杂任务,例如数学问题。然而,通过使用思维链(Chain-of-Thought, CoT )提示策略 LLM 可以通 过利用包含中间推理步骤的提示机制来解决这类任务,从而 得出最终答案。这种能力可能是通过在代码上进行训练而获得。

大模型的关键技术

训练:由于巨大的模型规模,成功训练一种能力强的 LLM 是非常具有挑战性的。分布式训练算法是学习 LLM 网 络参数所必需的,其中通常联合使用各种并行策略。

能力引导:使用自然语言表达的任务描述对 LLM 进行指令微调,以提高 LLM 在未见 任务上的泛化能力。然而,这些技术主要对应于 LLM 的涌现 能力,可能对小语言模型的效果不同。

对齐微调: 由于 LLM 被训练用来捕捉预训练语料库的数据特征(包括高质量和低质量的数据),它们可能会为人类 生成有毒、偏见甚至有害的内容。因此,有必要使LLM 与人类价值观保持一致
利用 基于人类反馈的强化学习技术。
工具操作:从本质上讲,LLM 是基于海量纯文本语料 库进行文本生成训练的,因此在那些不适合以文本形式表达的任务上表现不佳(例如数字计算),此外,它们的能力也受限于预训练数据,例如无法获取最新信息。为了解决这些问题,最近提出了一种技术,即利用外部工具来弥补 LLM 的不足 。例如,LLM 可以利用计算器进行准确计算 ,利用搜索引擎检索未知信息 。最近ChatGPT 已经实现了使用外部插件(现有或新创建的应用程序)的机制,这类似于 LLM 的“眼睛和耳朵”。这种机制可以广泛扩展 LLM 的能力范围。

文献:大语言模型综述

以下是对提供的参考资料的总结,按照要求结构化多个要点分条输出: 4G/5G无线网络优化与网规案例分析: NSA站点下终端掉4G问题:部分用户反馈NSA终端频繁掉4G,主要因终端主动发起SCGfail导致。分析显示,在信号较好的环境下,终端可能因节能、过热保护等原因主动释放连接。解决方案建议终端侧进行分析处理,尝试关闭节电开关等。 RSSI算法识别天馈遮挡:通过计算RSSI平均值及差值识别天馈遮挡,差值大于3dB则认定有遮挡。不同设备分组规则不同,如64T和32T。此方法可有效帮助现场人员识别因环境变化引起的网络问题。 5G 160M组网小区CA不生效:某5G站点开启100M+60M CA功能后,测试发现UE无法正常使用CA功能。问题原因在于CA频点集标识配置错误,修正后测试正常。 5G网络优化与策略: CCE映射方式优化:针对诺基亚站点覆盖农村区域,通过优化CCE资源映射方式(交织、非交织),提升RRC连接建立成功率和无线接通率。非交织方式相比交织方式有显著提升。 5G AAU两扇区组网:与三扇区组网相比,AAU两扇区组网在RSRP、SINR、下载速率和上传速率上表现不同,需根据具体场景选择适合的组网方式。 5G语音解决方案:包括沿用4G语音解决方案、EPS Fallback方案和VoNR方案。不同方案适用于不同的5G组网策略,如NSA和SA,并影响语音连续性和网络覆盖。 4G网络优化与资源利用: 4G室分设备利旧:面对4G网络投资压减与资源需求矛盾,提出利旧多维度调优策略,包括资源整合、统筹调配既有资源,以满足新增需求和提质增效。 宏站RRU设备1托N射灯:针对5G深度覆盖需求,研究使用宏站AAU结合1托N射灯方案,快速便捷地开通5G站点,提升深度覆盖能力。 基站与流程管理: 爱立信LTE基站邻区添加流程:未提供具体内容,但通常涉及邻区规划、参数配置、测试验证等步骤,以确保基站间顺畅切换和覆盖连续性。 网络规划与策略: 新高铁跨海大桥覆盖方案试点:虽未提供详细内容,但可推测涉及高铁跨海大桥区域的4G/5G网络覆盖规划,需考虑信号穿透、移动性管理、网络容量等因素。 总结: 提供的参考资料涵盖了4G/5G无线网络优化、网规案例分析、网络优化策略、资源利用、基站管理等多个方面。 通过具体案例分析,展示了无线网络优化中的常见问题及解决方案,如NSA终端掉4G、RSSI识别天馈遮挡、CA不生效等。 强调了5G网络优化与策略的重要性,包括CCE映射方式优化、5G语音解决方案、AAU扇区组网选择等。 提出了4G网络优化与资源利用的策略,如室分设备利旧、宏站RRU设备1托N射灯等。 基站与流程管理方面,提到了爱立信LTE基站邻区添加流程,但未给出具体细节。 新高铁跨海大桥覆盖方案试点展示了特殊场景下的网络规划需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值