AI大模型
文章平均质量分 94
AI大模型相关的一些学习笔记、思考、问题记录等
rs勿忘初心
刻意练习,享受创造的快乐。公众号:rs勿忘初心
展开
-
Llama 3.1用了1.6万个英伟达H100 GPU,耗费......
当地时间 2024年 7月 23号,Meta 公司发布了迄今为止最强大的开源 AI 模型 Llama 3.1。该模型不仅规模庞大,性能也堪比最强大的闭源模型。这称得上是开源 AI 领域的一个重要里程碑。Llama 3.1 模型家族总共有三个版本,规模最大的旗舰版本拥有 405B(4050 亿)参数,是近年来最大的开源 AI 模型。其余两个较小版本的参数量分别是 700 亿和 80 亿。原创 2024-08-08 17:56:49 · 1117 阅读 · 0 评论 -
深度解析:大模型开源的真与假
开源大模型和闭源大模型各有其优势和挑战,也不是对立面。在数据隐私、商业应用和社区参与方面,它们展现出不同的特点和潜力。选择更看好哪一种路径,取决于你所重视的因素和目标。无论是开源还是闭源,推动AI技术的发展和应用,共同促进智能时代的到来,是我们作为掌舵者共同的目标。开源项目是为了分享这个世界,那么就可能必然会舍弃掉资源的保密性和私人性,但其在创新速度、透明性、教育和社区参与方面的优势非常明显,我认为瑕不掩瑜。原创 2024-08-08 11:46:46 · 934 阅读 · 0 评论 -
快速了解GPT-4o和GPT-4区别
在5月14日的OpenAI举行春季发布会上,OpenAI在活动中发布了新旗舰模型“GPT-4o”!据OpenAI首席技术官穆里·穆拉蒂(Muri Murati)介绍,GPT-4o在继承GPT-4强大智能的同时,进一步提升了文本、图像及语音处理能力,为用户带来更加流畅、自然的交互体验,更多详情可点击查看官网(需科学上网)。GPT-4o的“o”代表“omni”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。GPT-4o是一个多模态大模型。原创 2024-06-28 10:08:21 · 2957 阅读 · 1 评论 -
大模型时代的APP:AI Agent(智能体)
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。具有自主性、反应性、交互性等特征的智能“代理”。大型语言模型(LLMs)的出现为智能代理的进一步发展带来了希望。长期以来,研究者们一直在追求与人类相当、乃至超越人类水平的通用人工智能(Artificial GeneralIntelligence,AGI)。在 1950 年代,Alan Turing 就将「智能」的概念扩展到了人工实体,并提出了著名的图灵测试。这些人工智能实体通常被称为—— Agent(代理)。原创 2024-06-20 16:28:50 · 1507 阅读 · 0 评论 -
大语言模型背景下,NLP从业者前景如何?要换个方向么?
大模型技术的发展,NLP行业短期可能会受强烈冲击,但长期来看未必是坏事,机遇与挑战一直是共存的。不局限于某个领域和技术,事实上一旦我们选择了技术岗,就意味着必须选择做一个终身学习者。ChatGPT这么强,会影响NLPer的就业环境吗 - 知乎。原创 2024-03-20 10:59:23 · 1915 阅读 · 1 评论 -
如何让ChatGPT更懂你?试试Custom Instructions与Memory机制
用简单提示词(prompt)完成复杂操作逻辑,提升 ChatGPT 对话体验。原创 2024-03-13 11:36:47 · 1160 阅读 · 0 评论 -
AI大模型相关产品的数据飞轮如何建设?
用户反馈越多,数据的质量就越高,高质量的数据,能让我们训练出更好的模型,而更好的模型,就意味着产品能够生成更高质量的内容,吸引更多的用户。数据飞轮是基于字节跳动十余年数据驱动实践经验提炼的企业数智化升级新范式,数据飞轮以数据消费为核心驱动,能够帮助企业数据流充分融入业务流,实现数据资产和业务应用相互促进飞轮效应,从而激发员工创造力,增强业务发展动力,提升组织生命力”。数据飞轮,是今年大模型带火的一个典型词汇,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。(老玩家也有对应的方式)原创 2023-11-27 14:54:01 · 2771 阅读 · 0 评论