CN116483971A用户问题智能回答方法、金融系统及存储介质
[旧方法]
1.分词
(1)得到用户问题&历史问题们的分词结果
2.向量化
(1)计算分词的向量。用BERT模型,分别获得用户和历史问题的分词向量。
(2)计算问题的向量。组合问题中包含的分词的向量,得到问题的向量。
3.计算相似度
(1)用余弦相似度计算代表问题的不同向量间的距离
[新方法]
1.分词
(1)数据预处理。清洗、文本纠错
(2)提取问题关键词。TF-IDF,每个问题提取后,得到一个或多个关键词。
2.向量化
(1)计算多维度特征
①关键词的词序
②关键词的词性
③句子长度
(2)计算句子之间的余弦相似度:用分词的向量组合,得到句子的向量
3.计算相似度
(1)将2.1和2.2加权求和
CN117151228A一种基于大模型与知识库生成的智能客服系统
系统 = [1]训练样本对获取模块 + [2]预测模块 + [3]输出模块
下面扩展一下[2]:词嵌入表示
1.embedding
(1)构建问题和回答对
①用pre-trained word2vec得到向量表示
②超参(一个单词的向量维度)是[1]中问题-回答对的sample的个数
③更新向量表示
④1.1.1得到的向量,丢进神经网络(残差+ReLU,叠两层),得到新的向量表示
2.计算embedding的隐藏状态
(1)捕捉问题和回答之间的关联
①计算注意力分数矩阵
(2)分别编码问题和回答的上下文信息
(3)用2.1和2.2计算,隐藏状态
3.overall就是transformer做带上下文的匹配
CN117312521A用于智能客服对话的处理方法及相关产品
匹配机制改进:聚类形成标准问题&标准答案。具体的实现技术方法没有细说。
流程改进:添加情绪监控,接入人工
CN117252600A一种基于大数据的智能客服系统及其方法
匹配机制 = 句向量(文本相似度) + 关键词(关键词差异系数) + 句子长度 = 问题匹配度指数
text representation:word count
CN117271700A集成智能学习功能的设备使用与维修知识库
系统 = 构建 + 使用 + 更新
知识库构建模块 = 并行处理 + 基于并行处理结果构建数据库(图+向量)
知识库使用模块 = 相似性搜索 + 大语言模型处理
知识库更新模块
RDF 教程 RDF(资源描述框架)