- 博客(6)
- 收藏
- 关注
原创 Transformer架构
6. 在原始的Transformer论文中,向量的大小实际上是512,这比我们能够在这个图像上容纳的要大得多。8. 在所有的注意力权重被应用到你的输入数据后,输出会通过一个。2. Transformer架构的关键属性之一是。所以,在将文本传入模型进行处理之前,你必须首先对词语进行。5. 当你的输入被表示为数字,你可以将其传递给。3. Transformer架构的工作原理。7. Transformer架构实际上具有。
2023-12-01 10:27:11 1011 1
原创 词向量原理解释
语言模型采用类似的方法:每个词向量代表了“词空间(word space)”中的一个点,具有相似含义的词的位置会更接近彼此。例如,Google研究人员取出最大的(biggest)向量,减去大的(big)向量,再加上小的(small)向量。在这个例子中,大(big)与最大的(biggest)的关系,类似于小(small)与最小的(smallest)的关系。• Mouse(老鼠)与mice(老鼠的复数)类似于dollar(美元)与dollars(美元的复数)。• 不道德的与道德的类似于可能的与不可能的。
2023-09-19 19:47:39 115
原创 如何用大模型生成会议纪要
1、 文本预处理:一旦有了文本数据,接下来需要进行一些文本预处理步骤,以准备文本进行进一步的分析和摘要生成。2、关键信息提取:接下来,系统可能会使用不同的NLP技术来提取会议中的关键信息。3、摘要生成:一旦有了关键信息,摘要生成模型会尝试根据这些信息生成简明扼要的会议纪要。背景:对券商、私募等用户来说,经常需要参加调研、访谈、路演等重要活动,活动中重要领导的讲话可能有重要信息,因此经常录音。而上线语音转文字功能,并帮助用户提取会议中的重要信息,生成会议纪要,对于用户来说十分重要。1. 忽略上下文关系。
2023-09-11 21:07:41 1107
原创 什么是神经网络?
在输入四个对应的x特征后,神经网络将产出三个隐藏层,在以下图示例中,第一个隐藏层单元我们将它定义为家庭成员数量,由面积和卧室数量决定,你也可以告诉神经网络,第一个隐藏层单元你可以决定这个单元是什么,也可以决定输入的特征与单元的联系。你可以把预测房价作为一个简单的神经网络,这也是最简单的神经网络之一了,假设把房屋面积x进行输入到一个黑盒,输出房屋价格y,这个黑盒就是神经网络的一个神经元,也是我们图上画的这个函数。假设你有一个房屋价格的数据集,x轴代表房屋的面积,y轴代表房屋的价格。
2023-08-29 15:33:54 102 1
原创 用深度神经网络模型预测行业营收
所选用的因子有库存、宏观、供给、进出口和销量几大因子,所涉及时间范围为2000-01-01~2023-06-01. 因子详情如下:(共12个),研究框架参考的是萝卜投资DataYes!价格(CPI:交通和通信:当月同比、PPI:汽车制造业:当月同比);new_sample_scaled = scaler.transform(new_sample_2d) # 对转换后的数据进行预处理。1. 库存:汽车经销商库存系数:综合、规模以上工业企业:产成品存货:汽车制造业:期末值、全国:民用汽车拥有量:总计。
2023-06-28 11:14:56 700 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人