第二部分:使用小型开源LLMs进行信息提取
小型开源LLMs简介
在AI和机器学习领域,小型开源大型语言模型(LLMs)的出现,特别是对于像金融这样数据安全和保密至关重要的行业来说,已经是一个游戏规则改变者。 这些模型提供了强大的语言处理能力和本地部署的灵活性,使它们成为金融机构的理想选择。
为何小型LLMs对金融机构至关重要
- 保密性和数据安全:金融机构处理敏感信息,包括法律和道德上禁止与外部分享的机密交易细节。 利用本地托管的LLMs确保所有数据处理在内部进行,维护数据保密性并遵守严格的监管标准。
- 定制化和控制:开源LLMs提供了根据特定机构需求定制化的灵活性。 金融机构可以调整这些模型,更好地理解和处理其独特的金融术语和交易语言,增强模型的相关性和准确性。
- 成本效益和可访问性:较小的LLMs资源需求较低,为可能没有支持像GPT-4这样的大型模型的基础设施的金融机构提供了更可访问和成本效益更高的解决方案。 这使得先进的AI技术可为更广泛的机构所用,实现对尖端工具的普及。
利用小型开源LLMs提取交易信息的过程
我们把利用LLMs从金融交易对话中提取有意义的信息分为两个步骤。 第一步识别对话中的交易类型,然后使用为每种交易类型量身定做的模板提取特定的交易信息。 本篇文章说明如何识别交易类型,下一篇介绍如何提取交易信息。
步骤一:识别交易类型
第一个关键步骤涉及从文本对话数据中确定交易类型。 过程如下:
- 合成数据生成:我们在第一部分:利用知识蒸馏生成合成交易信息中生成了一些交易数据。 以下是一个例子:
{
"model": "gpt-4-1106-preview",
"trade_type": "FX Double Barrier Knock-In Option",
"currency": "NZDUSD",
"trader1": {
"name": "Alice",
"style": "descriptive",
"emotion": "skeptical",
"tone": "neutral",
"attitude": "open-minded",
"perspective": "first-person"
},
"trader2": {
"name": "Bob",
"style": "conversational",
"emotion": "happy",
"tone": "passive"