m0_61977748
码龄3年
关注
提问 私信
  • 博客:7,197
    7,197
    总访问量
  • 6
    原创
  • 125,977
    排名
  • 114
    粉丝
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2021-09-16
博客简介:

m0_61977748的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    1
    当前总分
    82
    当月
    1
个人成就
  • 获得131次点赞
  • 内容获得1次评论
  • 获得155次收藏
创作历程
  • 6篇
    2024年
成就勋章
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

179人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

大语言模型入门之Embedding

LLM中的Embedding是一个至关重要的概念,它在大规模语言处理任务中发挥着核心作用。这篇用于介绍Embedding。一、LLM中的Embedding是一种将高维数据转换为低维向量表示的技术,它在自然语言处理任务中发挥着重要作用。通过捕捉文本的语义信息并降低数据维度,Embedding使得计算机能够更好地理解和处理自然语言数据。随着技术的不断进步,我们可以期待Embedding在未来发挥更加重要的作用。
原创
发布博客 2024.07.20 ·
455 阅读 ·
4 点赞 ·
0 评论 ·
6 收藏

大语言模型入门之Tokenization

LLM(Large Language Model,大型语言模型)的Tokenization是自然语言处理(NLP)中的一个重要步骤,它指的是将原始文本转换成模型可以理解和处理的离散符号序列的过程。Tokenization是LLM处理文本数据的基石,它将自然语言文本分解成更小的单元或标记(Token),这些Token可以是单词、单词的一部分(如子词)、甚至是一个字符。然后这些 token 被转换成向量(vector),它们是这些单词的数字表示。
原创
发布博客 2024.07.16 ·
761 阅读 ·
24 点赞 ·
0 评论 ·
9 收藏

大语言模型入门之Prompt Engineer

这篇用于介绍Prompt Engineer提示工程指南 | Prompt Engineering Guide (promptingguide.ai)大语言模型Prompt工程-原理详解篇 - 知乎 (zhihu.com)由于篇幅问题,这里只是简单的介绍一下Prompt Engineer相关概念,具体的可以看提示工程指南那篇,写的非常具体。1.Prompt在大语言模型中,"Prompt"(提示)指的是用户输入的文本或问题,它作为模型开始生成回复的初始信息。
原创
发布博客 2024.07.16 ·
767 阅读 ·
14 点赞 ·
0 评论 ·
25 收藏

大语言模型入门之综述阅读

这篇主要通过阅读大语言模型综述《Large Language Models:A Survey》来学习LLM的一些概念和基础知识。从零开始学习大语言模型(一)_哔哩哔哩_bilibili最新语言大模型综述 Large Language Models A Survey_large language models: a survey-CSDN博客本文综述了大型语言模型(LLMs)的研究进展和应用情况。LLMs通过在大量文本数据上训练数十亿个参数,实现了对自然语言的理解和生成能力。
原创
发布博客 2024.07.15 ·
1503 阅读 ·
44 点赞 ·
0 评论 ·
33 收藏

大语言模型入门之Transformer

现在的很多大语言模型通常是基于Transformer架构,这篇用于介绍Transformer架构。由于之前是学三维重建的,也学习过了Transformer,网上也有很多transformer的详细介绍,这里主要是做个回顾。一、Transformer模型的出现,极大地推动了NLP领域的发展。它不仅在机器翻译任务上取得了显著的成果,还被广泛应用于文本生成、文本摘要、语音识别、图像识别等多个领域。许多知名的预训练语言模型,如BERT、GPT和T5等,都是基于Transformer架构构建的。
原创
发布博客 2024.07.10 ·
1659 阅读 ·
19 点赞 ·
0 评论 ·
51 收藏

如何用Python调用智谱AI的API

智谱AI大模型以GLM(General Language Model)系列为核心,由清华大学、北京智源人工智能研究院等顶尖机构联合研发。这些模型通过自回归填空任务进行预训练,并采用Transformer架构,能够在各种自然语言理解和生成任务上进行微调,展现出强大的语言处理能力。其中,GLM-130B是智谱AI在2022年开源的一个重要模型,它基于GLM的进一步开发,在归一化、激活函数、掩码机制等方面进行了优化,成为高精度千亿规模的中英双语语言模型。
原创
发布博客 2024.07.06 ·
2019 阅读 ·
26 点赞 ·
1 评论 ·
31 收藏