大模型落地实践：同花顺大模型技术应用及优化

澜舟孟子开源社区

于 2022-08-11 14:35:58 发布

阅读量3k

点赞数

分类专栏：认知智能-NLP前沿观点文章标签：人工智能自然语言处理语音识别算法

本文链接：https://blog.csdn.net/langboat_mengzi/article/details/126284647

版权

本文介绍了大模型在同花顺业务中的应用，包括问答、对话、信息抽取和舆情监控，并展示了大模型优化的技术，如Continue-Train和模型轻量化。通过实例展示了大模型在金融领域提升效率和准确性的成果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者介绍：谌明，浙江核新同花顺网络信息股份有限公司首席技术官，浙江省金融信息工程技术中心副主任，之江实验室金融大数据智能计算实验平台专家；曾主持多个国家重点项目，总投入资金数亿元；发表 SCI/EI 高水平学术论文 20 余篇，申请或授权发明专利 31 项；荣获中国 IT 年度人物杰出 CTO 和杰出工程师等奖项。

本文根据 谌明 老师在「澜舟NLP分享会」上的演讲整理。文内从业务角度介绍了大模型技术在同花顺业务上的应用以及未来探索的方向。

众所周知，大模型参数量大，通用能力强，综合性能好。但在同花顺业务场景中最初使用大模型的时候，发现用大模型的效果与传统方法差距不大，甚至有时候逊于原先传统的方法。所以最初在业务角度并不够重视，然而近期随着大模型技术的快速发展，我们也在逐步尝试将大模型在业务中落地，目前大模型在自然语言处理相关的业务里都取得了比传统模型更优的效果，下面详细介绍相关工作。

图 1

同花顺业务场景中的大模型

1. 问答

图 2

同花顺的问答业务主要是“同花顺问财”，主要场景在同花顺APP语音助手、问财APP端、问财Web端等。业务形式是将用户输入的问句解析为 condition （比如股票标的、指标、时间），然后从同花顺的后台海量的金融数据中取数并生成回答、表格等（如图 2 右侧所示）。

问句涉及的领域一般领域包括常见的征信市场、股市、基金市场、债券，也会包括一些宏观业务等。目前问财的用户每日问句数量大概在 1000 万左右，累计不同问句数量约 5 亿。用户量也很大，大约 300+万。这个问句量和用户量在问答系统中应该算非常大的。

图 3

问财对话系统在大模型的应用上有几个难点。

首先，它偏重金融业务知识，并且对于时效性要求很高。 这里特别说明一下“时效性”的问题。之前很多典型的问答系统一般会有这类常识问题，比如“世界最高的山是什么？”“中国的首都是哪里？”，但在问财里碰到的用户提问往往是“今天的股价”，而提到股价就涉及到“今天股价的变化情况”；或者用户问“某个公司的业绩如何”等等，这里就涉及到时间维度，因为每个公司年报、半年报或季度报发布的时间点不同，如果用户在前一天问，系统回答的是年报的结果；如果用户在今天问，系统可能就要回答季报的内容了，所以时效性问题非常重要，要保证用户获得最新的信息。

第二个难点是精确性问题。现在很多大模型的知识是通用的、持久不变的知识，但在问财系统里的知识在不同情况下会有一些变化，内含了一些金融逻辑。如果出现给用户返回的结果错误，就可能会导致很严重的问题，