神经网络
文章平均质量分 78
张3蜂
致力于分享自己的心得,以开放的心态接受网友专家的批评指正。感谢大家提出的宝贵建议。
展开
-
魔搭上的Transformer原理图是倒着画的,大家看看正过来的效果哪个好?
魔搭上的原理图:原创 2024-09-13 09:23:40 · 36 阅读 · 0 评论 -
什么是大模型的推理?
你可能会根据你过去的经验和常识做出猜测,最有可能的是:“早餐” 或者 “面包”。你不会猜“手机”或“书”这样的词,因为它们不符合句子的上下文。大模型的推理过程主要是基于海量数据的训练,来生成或预测出最可能的输出。以语言模型为例,它是通过输入一段文本(称为。:想象你和朋友在玩一个猜谜游戏。朋友给你一个不完整的句子:“我今天早上吃了……”,你要猜出最后的单词。,通过这些参数,模型能够为每个可能的输出分配一个概率,最终选择最可能的结果。)并根据之前的上下文预测下一个词或句子。这一过程依赖于模型内部的大量。原创 2024-09-12 09:45:01 · 232 阅读 · 0 评论 -
大模型中的token是干什么用的?
在大模型中,是模型处理语言的基本单位,它就像语言的“拼图块”。我们可以把 token 想象成一句话或一段文字中的“碎片”,这些碎片可以是一个单词、一个词的一部分,或者甚至是一个符号。模型通过理解和处理这些 token 来完成任务,比如翻译、回答问题、生成文本等。原创 2024-09-10 08:36:35 · 290 阅读 · 0 评论 -
人工智能领域的性能指的是什么
在人工智能(AI)领域,"性能"(performance)通常指的是一个AI系统或模型在执行特定任务时的表现和效率。AI的性能可以从多个角度衡量,具体取决于任务的类型和应用场景。原创 2024-09-08 21:08:08 · 836 阅读 · 0 评论 -
通过API方式访问llama3
API方式访问llama3结果如下:原创 2024-09-03 20:50:05 · 270 阅读 · 0 评论 -
LLama3本地部署安装
5.控制台中键入ollama run llama3:8b,会自动进行8B模型下载,该模型有80亿参数,普通电脑可以执行。4.进入官网找到想要下载的模型名称 https://ollama.com/library/llama3/tags。这篇教程将指导你如何在本机上安装 LLama3 客户端和可视化对话界面,我们会分为三部分:安装 LLama3 客户端、部署大模型和设置模型文件路径。3.打开cmd控制台,键入ollama,如果如下图显示命令提示就说明安装已经成功。如果需要解除限制,或是其他微调功能,可以在。原创 2024-08-23 10:07:37 · 935 阅读 · 0 评论 -
Transformer 模型详解
Transformer 是一种基于注意力机制的神经网络架构,它最初是为了解决机器翻译问题而提出的,但它的应用范围现在已经扩展到许多自然语言处理(NLP)任务,如文本生成、情感分析、语音识别等。不同于传统的递归神经网络(RNN)或卷积神经网络(CNN),Transformer 利用全局的自注意力机制(Self-Attention)在不依赖顺序处理的情况下高效地处理序列数据。原创 2024-08-20 09:00:03 · 507 阅读 · 0 评论 -
深入理解命名实体识别(NER)
命名实体识别(NER,Named Entity Recognition)是自然语言处理(NLP)中的一项重要技术,用于从文本中识别出特定类型的实体,并将这些实体分类到预定义的类别中。实体通常包括人名、地名、组织名、日期、时间、数量、货币等。例如,在句子“Barack Obama was born in Hawaii in 1961”中,NER任务的目标是识别“Barack Obama”作为人名,“Hawaii”作为地名,以及“1961”作为日期。原创 2024-08-12 00:24:46 · 362 阅读 · 0 评论 -
什么是NLP实体识别?
实体识别是自然语言处理中的一个子任务,其主要目标是识别文本中的实体,并将这些实体分类为预定义的类别(如人名、地名、组织名、时间、数值等)。例如,在句子“苹果公司在2024年发布了新款iPhone”中,实体识别任务将识别出“苹果公司”作为组织名,“2024年”作为时间,“iPhone”作为产品名。基于规则的方法通过预定义的规则或模式来识别实体。规则通常由领域专家制定,涉及模式匹配、正则表达式、词典查找等。例如,可以使用正则表达式来匹配可能的英文人名,或使用词典查找常见的公司名。简单易用,容易理解和维护。原创 2024-08-08 21:50:35 · 898 阅读 · 0 评论