自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 放弃评测大模型,普林斯顿大学已经开始评估Prompt了,提出Prompt评估框架

这篇论文具有一个有趣的结论,在实际的 Prompt 工程之中有时简单的 Prompt 生成方式有时也会取得良好的性能,在 Few-shot 的设置之中,任务无关的方法会表现出更好的性能,而一些自动生成 Prompt 的方法则往往会缺乏竞争力,无法享受 Prompt 对模型性能带来的提升。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-07-08 09:45:00 983

原创 更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了

一夜之间,大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。今日,Meta 终于发布了大家期待已久的免费可商用版本 Llama 2。此次 Meta 发布的。此外还训练了 340 亿参数变体,但并没有发布,只在技术报告中提到了。据介绍,。具体来说,Llama 2 预训练模型是在上训练的,精调 Chat 模型是在的。

2024-07-08 09:00:00 872

原创 世界级AI大佬吴恩达:LLM CookBook 汉化版

粉丝们久等了!!!我又来更LLM大模型的必备读物啦!这次给大家推荐的是AI圈无人不知的吴恩达大佬+OpenAI团队一起编写的大模型入门文档也就是这本:大型语言模型(LLM)的权威文档粉丝们久等了!!!我又来更LLM大模型的必备读物啦!这次给大家推荐的是AI圈无人不知的吴恩达大佬+OpenAI团队一起编写的大模型入门文档也就是这本:大型语言模型(LLM)的权威文档在Github上已经高达56.8k star了,这含金量啧啧啧。

2024-07-08 07:15:00 827

原创 大模型何去何从?

大模型的未来发展方向是怎么样的?这篇文章里,作者分享了几条主线,并围绕这些主线做了一些思考和分析,不妨来看一下。在人工智能领域,大模型已经成为了一种强大的驱动力,它们通过海量的参数和复杂的结构,展现出了在多种任务上的卓越性能。未来,大模型的发展方向应当围绕几个主线进行:技术创新、应用拓展、生态系统构建、伦理与法律考量,以及社会影响。以下是对这些主线的深入思考,结合实际案例进行分析。

2024-07-05 11:15:51 1084

原创 推特竞品上线7小时用户破1000万,马斯克:竞争可以,但不要作弊!

7个小时,1000万用户。这是Meta对标推特产品,上线7个小时的成绩。现在,Threads的用户数量已经超过3000万,在多个国家与地区的App Store占据下载量榜首。要知道,科技圈顶流ChatGPT,也花了5天时间才达到100万用户量。

2024-07-04 10:37:36 227

原创 如何智能生成吸引人又符合实际的标题?

如果仔细分析一下,

2024-07-04 10:36:10 592

原创 AI大模型入门终极教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!

在人工智能(AI)技术日新月异的今天,大模型作为该领域的璀璨明珠,正引领着技术革新的浪潮,成为推动社会进步与产业升级的关键力量。这些大模型凭借其卓越的数据处理效能与深邃的模式识别能力,在自然语言处理、计算机视觉、智能推荐等多个维度上展现出非凡的潜力,为各行各业铺设了通往智能化转型的康庄大道。随着大模型技术的普及与应用深化,企业对相关人才的需求急剧增长,尤其是AIGC(人工智能生成内容)领域的高端人才更是供不应求,薪资水平持续攀升。

2024-07-03 11:08:45 995

原创 上海AI lab提出VideoChat:可以与视频对话啦

视频相比语言、图像,是更复杂更高级的一类表征世界的模态,而视频理解也同样是相比自然语言处理与计算机视觉的常见工作更复杂的一类工作。?现在答案到来了,。区别于现有多模态大模型针对视频输入的处理方法,即首先文本化视频内容再接入大模型利用大模型自然语言理解的优势,。这样一种方式可以有效的避免视觉信息、时空复杂性信息丢失的问题,第一次创立了一个高效、可学习的视频理解系统,可以实现与 VideoChat 对视频内容的有效交流。

2024-07-03 11:01:09 694

原创 Transformer论文被发现错误! 架构图与代码「不一致」

论文中的图有时会出现与实现代码不对应的情况,这会让读者头大,不知是有意还是无意为之。这次,没想到大名鼎鼎的 Transformer 论文也「翻车」了。2017 年,谷歌大脑团队在其论文《Attention Is All You Need》中创造性的提出 Transformer 这一架构,自此这一研究一路开挂,成为当今 NLP 领域最受欢迎的模型之一,被广泛应用于各种语言任务,并取得了许多 SOTA 结果。

2024-07-03 10:51:20 320

原创 AI大模型全栈工程师课程笔记 - LangChain 概览

LangChain 是一个强大的库,旨在帮助开发者利用大型语言模型(如 GPT-4、ChatGPT、LLaMA 等)构建复杂的应用程序。它提供了多种工具和模块,使得开发者能够轻松地构建基于自然语言处理的智能系统,如问答系统、代码生成器、内容创作助手等。本课程将深入探讨 LangChain 的核心概念、使用方法以及如何通过它构建高效、可扩展的 AI 应用。Chains(链):Components(组件):Prompts(提示):安装 LangChain:构建链:使用 LangChain 提供的类或函数构

2024-07-02 11:21:45 983

原创 1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下

研究团队所推出的 Prompt2Model 框架实现了仅通过自然语言提示来自动构建任务特定模型的功能。这一创新显著地降低了构建定制化自然语言处理模型的门槛,进一步扩展了 NLP 技术的应用范围。验证实验结果显示,Prompt2Model 框架所生成的模型相较于大型语言模型,其规模显著减小,且在多个任务上表现优于诸如 GPT-3.5-turbo 等模型。同时,该框架生成的评估数据集也被证实能够有效评估不同模型在真实数据集上的性能。这为指导模型的最终部署提供了重要价值。

2024-07-02 11:11:48 289

原创 LeCun再泼冷水:只会看书的语言模型永远无法实现「类人智能」

问题不在语言模型的学习算法,而是语言本身的固有局限性,多模态将引领下一次AI爆发!自去年ChatGPT发布后,业内外都涌现出了一股对大型语言模型的狂热情绪,甚至有谷歌员工宣称公司内部的语言模型有了意识。

2024-07-02 11:10:41 634

原创 风口上的大模型 还要飞多久?

新视界、新思维、新洞察2024年以来,科技圈最热的词语就是ChatGPT及其背后的大模型技术。自ChatGPT爆火之后,国内起了一股“备战”大模型之风,短短数月,各类企业研发和发布的大模型如雨后春笋般涌现。大模型是AI的基础设施,谁的大模型更强大,谁就会在未来的竞争中更有主动权和话语权。对于科技企业来说,“大模型之战”,可谓是不得不打,也必须打出成绩。简石资本投资合伙人蓝云鹏在接受《中国信息化周报》采访时表示,大模型的战力如何取决于算力、算法、框架、工程化、人才等多方面的综合实力。

2024-06-30 15:49:39 843

原创 扩散模型新应用——微软推出蛋白质生成框架EvoDiff

最近,微软推出了一个名为的通用框架,据称它可以根据蛋白质序列生成“”和“”的蛋白质。这项技术的意义非凡,因为蛋白质是构成我们身体的疾病的基本组成部分。通过研究蛋白质,我们可以揭示疾病的机制,并找到减缓或逆转疾病的方法。而通过,我们可以开发全新的药物和治疗方法。目前,设计蛋白质的过程非常复杂且昂贵,但EvoDiff的出现可能会改变这一现状。它不需要目标蛋白质的结构信息,从而省去了最繁琐的步骤。这项技术有望应用于新型治疗药物和药物传递方法的酶的创造,以及用于工业化学反应的新型酶的开发。

2024-06-30 15:47:03 633

原创 扩散模型新应用——微软推出蛋白质生成框架EvoDiff

最近,微软推出了一个名为的通用框架,据称它可以根据蛋白质序列生成“”和“”的蛋白质。这项技术的意义非凡,因为蛋白质是构成我们身体的疾病的基本组成部分。通过研究蛋白质,我们可以揭示疾病的机制,并找到减缓或逆转疾病的方法。而通过,我们可以开发全新的药物和治疗方法。目前,设计蛋白质的过程非常复杂且昂贵,但EvoDiff的出现可能会改变这一现状。它不需要目标蛋白质的结构信息,从而省去了最繁琐的步骤。这项技术有望应用于新型治疗药物和药物传递方法的酶的创造,以及用于工业化学反应的新型酶的开发。

2024-06-30 15:33:35 335

原创 谷歌与OpenAI合作,用Google Search为大模型刷新!

这种研究方法的确为整合动态变化的知识到语言模型中提供了一个创新方案,允许从Google Search中获取相关证据是一个强大的功能,可以使模型保持其答案的时效性,尤其在当前的快速变化的信息时代。但是该方法的一个主要限制是需要定期更新答案。这意味着,为了保持答案的准确性和时效性,必须持续投入资源和时间。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-06-30 15:30:15 617

原创 大模型应用创业:十字路口的抉择,未来机遇何在?

随着科技的飞速发展,新时代的浪潮再次席卷而来。今年,ChatGPT的崛起彻底点燃了科技圈和创投圈的激情。从年初至今,短短九个月间,AIGC领域的创业者数量迅速攀升。据科技部统计,截至今年5月,中国已发布79个10亿参数规模以上的大模型。如今,根据业内专家的估算,国内大模型的数量已接近200个,甚至有券商报告指出,行业正步入“万模大战”的时代。然而,这种井喷式的增长显然已经远远超出了市场的实际需求。与此同时,AI技术的迅猛迭代和行业基座的飞速进化,使得大模型创业领域的商业模式陷入进退两难的境地。

2024-06-29 17:34:24 205

原创 强迫症福音!一个小技巧,让DALLE-3创作排列美学

大模型的应用是一次创意和智能的冒险!这些强大模型不仅能够回答问题,还可以为你带来有趣的小应用。你可以创建自动化工具,撰写幽默笑话,制作艺术品,教育他人,或者仅仅享受其中的乐趣。大模型的可能性无限,让我们一起探索这个令人兴奋的世界吧!读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-06-29 17:30:40 610

原创 深度学习可解释性新进展!Claude团队利用字典学习分解大模型神经元

神经网络的不可解释性,一直是AI领域的“老大难”问题。但现在,我们似乎取得了一丝进展——ChatGPT最强竞对Claude背后的公司,利用字典学习成功将大约分解成了约。具体而言,神经元具有不可解释性,但经过这一分解,Anthropic发现每一个特征都代表了不同的含义,比如有的分管DNA序列,有的则表示HTTP请求、法律文本等等,也就是具备了可解释性。。比如开启DNA特征就能使模型输出DNA,开启阿拉伯文字特征就让模型输出阿拉伯文字。

2024-06-29 17:28:28 545

原创 AI大模型全套零基础教程

如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-06-28 10:14:44 1570

原创 GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gemini!

随着今年秋天的临近,谷歌和OpenAI的多模态模型之战,也进入到白热化阶段。就在上周,谷歌已经对一些外部公司开放了多模态大模型Gemini的功能。而OpenAI,当然不会坐以待毙。他们正在争分夺秒地把多模态功能整合进GPT-4里,争取推出功能与Gemini类似的多模态大模型,一举击杀谷歌。传说中的多模态功能,在今年3月OpenAI那场震惊全世界的GPT-4发布会上,已经被展示过——,在纸上画个草图,拍个照发给GPT-4,说一声「给我按照这种布局做个网站」,它立马就写出了网页代码。

2024-06-28 10:13:30 531

原创 第一个在AlpacaEval上超越GPT-4的模型,出现了!

第一个在AlpacaEval上超越GPT-4的模型,出现了!今年6月,AlpacaEval榜单一公布,GPT-4就以绝对领先的优势夺得第一,胜率超过95%。三个月后,一匹叫Xwin-LM的黑马,居然把稳居榜首的GPT-4从TOP 1拉下来了?而且,Xwin-LM在同参数模型的对垒中,也毫无例外地拿下了三个第一:Xwin-LM-70B-V0.1:在AlpacaEval基准测试中对Davinci-003的胜率达到95.57%,在AlpacaEval中排名第一。

2024-06-28 10:11:33 926

原创 一文告诉你,做PMS产品经理你得懂什么

PMS,英文全称。

2024-06-27 10:52:30 1089

原创 谷歌与OpenAI合作,用Google Search为大模型刷新!

这种研究方法的确为整合动态变化的知识到语言模型中提供了一个创新方案,允许从Google Search中获取相关证据是一个强大的功能,可以使模型保持其答案的时效性,尤其在当前的快速变化的信息时代。但是该方法的一个主要限制是需要定期更新答案。这意味着,为了保持答案的准确性和时效性,必须持续投入资源和时间。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-06-27 10:50:01 274

原创 强迫症福音!一个小技巧,让DALLE-3创作排列美学

大模型的应用是一次创意和智能的冒险!这些强大模型不仅能够回答问题,还可以为你带来有趣的小应用。你可以创建自动化工具,撰写幽默笑话,制作艺术品,教育他人,或者仅仅享受其中的乐趣。大模型的可能性无限,让我们一起探索这个令人兴奋的世界吧!读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-06-27 10:48:36 275

原创 产品经理用AI,跟普通人玩转AI有啥不一样?

随着AI(人工智能)技术的普及,我们越来越多地接触到各种AI工具和应用。但是,当产品经理和普通人都开始使用AI时,他们之间的区别是什么呢?首先,。产品经理使用AI是为了更好地设计、开发和优化产品,比如通过AI分析用户数据来改进产品功能,或者利用AI进行自动化测试以提高工作效率。而普通人使用AI可能更多是为了让生活更便捷,比如用智能音箱播放音乐、查询天气,或者通过AI相机识别照片中的人物和场景。其次,。产品经理需要深入了解AI技术的原理和算法,以便能够灵活运用AI技术解决产品设计和运营中的问题。

2024-06-26 11:05:18 654

原创 深度学习可解释性新进展!Claude团队利用字典学习分解大模型神经元

神经网络的不可解释性,一直是AI领域的“老大难”问题。但现在,我们似乎取得了一丝进展——ChatGPT最强竞对Claude背后的公司,利用字典学习成功将大约分解成了约。具体而言,神经元具有不可解释性,但经过这一分解,Anthropic发现每一个特征都代表了不同的含义,比如有的分管DNA序列,有的则表示HTTP请求、法律文本等等,也就是具备了可解释性。。比如开启DNA特征就能使模型输出DNA,开启阿拉伯文字特征就让模型输出阿拉伯文字。

2024-06-26 11:00:54 898

原创 奥特曼YC演讲:套壳ChatGPT者死,我行不代表你行

奥特曼简单一句话,让AI创业公司瑟瑟发抖:“套壳”OpenAI,注定消亡!这是在最新YC校友分享会上,OpenAI CEO奥特曼发表的演讲观点。为此他还特意补充道:尤其别花太多精力在UI界面上。一时间引发共鸣无数。不少业内人士表示:现实是,我就在目睹很多这样的事情发生。除了这句话以外,奥特曼这段演讲中可谓金句频出,个中不少“干货细节”,也被大伙儿纷纷摘录转发——包括GPT-5、6的进展,关于AGI未来趋势的看法,以及亲身创业的种种。比如,“AI女友”只是个美丽的陷阱,千万不要轻易尝试。

2024-06-26 10:59:31 689

原创 AI大模型教程引领时代浪潮,你准备好了吗?

随着ChatGPT掀起的人工智能热潮,“AI大模型”已成为业界瞩目的焦点。从Google到百度,再到腾讯等互联网巨头,都在积极布局人工智能技术,抢占市场先机。甚至有人因此获得了高达60k*16的丰厚薪酬,这无疑证明了AI大模型领域的人才炙手可热。作为身处这一时代的普通程序员,你是否也想跟上时代的步伐,不被潮流所淘汰,更进一步享受AI技术带来的红利呢?现在,一个绝佳的机会摆在了你的面前——一份被誉为“我见过的最强AI大模型教程”正在向你招手,带你走进AI大模型的精彩世界。

2024-06-25 11:26:15 653

原创 推理成本增加10倍?对文心大模型4.0的一些猜想

相信不少小伙伴这几天都听到了消息,在期待下周即将发布的文心大模型4.0。我们的几个读者群里也发生了相关的讨论:作为AI从业者,卖萌酱将基于目前得到的一些有限的消息,来展开一些分析和猜想,供读者们参考。

2024-06-25 11:21:30 1063

原创 谷歌、AMD、英特尔加入挑战,英伟达AI解决方案还能继续“遥遥领先”吗?

在人工智能基础设施板块,谷歌、AMD、英特尔、亚马逊等巨头不甘落后,而英伟达也采取了多元化战略,誓要牢牢守住目前的地位。

2024-06-25 11:18:37 588

原创 AI重塑软件业:为何学习大模型成为必选项?

近日,一篇名为《The End of Software》的短文在推特和谷歌文档上引发了科技/投资圈的热议。这篇由Pace Capital创始合伙人Chris Paik撰写的文章,提出了一个引人深思的观点:在人工智能(AI)的推动下,软件行业正经历一场深刻的变革。这不仅仅是一场技术的革新,更是一场思维方式的革命。Paik通过对比内容行业在互联网冲击下的变化,提出了一个有趣的类比:传统软件正在被AI技术所“吞噬”,就像曾经的媒体行业被用户生成内容所颠覆一样。

2024-06-24 11:21:15 818

原创 AI大模型,下了一盘好棋。

网址:https://kimi.moonshot.cn/有网页版也有应用版网页截图如下:主要功能:1、长文本处理能力,支持 最多200万字的输入和输出;支持多文件处理。2、联网和信息获取能力,互联网访问;实时信息获取,能够满足实时信息的处理,具有时效性。3、文件读取和解析能力,它能够读取和解析多种格式的文件,包括TXT、PDF、Word文档、PPT幻灯片和Excel电子表格等;Kimi不仅能够读取文件内容,还能够对内容进行整合和分析,为用户提供更加深入的见解和总结。

2024-06-24 11:12:53 649

原创 大模型面试高频问题

coding轮,概念轮都考。各种Norm,这个频率也不低,不过比较标准的内容,没有啥特意要说的,有的考手写,有的考概念和理解(为什么管用)。从考察问题延展到考察知识点,再到如何优雅回答一面俱全,可以说是求职面试的必备宝典,每一部分都有上百页内容,接下来具体展示,完整版可直接下方扫码领取。\3. BERT,GPT等比较主流大模型,一些细节,比如位置编码,训练loss,激活,架构些许不同这种。\6. evaluation,如何评估大模型,安全性,有效性,公开数据,个别考过手写eval框架(多选,生成)。

2024-06-24 07:15:00 1115

原创 解密PC的AI进化:AI大模型如何“压”进PC?

当地时间2024年1月9日,2024年国际消费电子展(CES 2024)在美国拉斯维加斯举办。AI for All成为CES大会的关键议题之一。在众多展品当中,被视作个人大模型普惠第一终端的AI PC吸引众多目光。全球最大的PC厂商联想集团更是推出了包括Yoga Pro 9i,ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、ThinkCentre neo Ultra在内的一众AI PC产品。

2024-06-21 15:47:43 586

原创 速看!这个AI大模型有望让手机“进化”为专属私人助理

如何让AI技术与智能手机结合把装进手机已经成为了各手机厂商最重要的课题之一11月1日,vivo在发布自研通用大模型矩阵——以及基于大模型打造的蓝心小V、蓝心千询等这也让vivo成为了率先使用自研大模型有望实现手机端侧大规模产品落地的手机厂商过去几年,存量市场的激烈争夺让手机行业苦苦追寻创新突破口。随着今年AI技术的大爆发,头部厂商纷纷把目光瞄准大模型,希望借助新技术锋芒,在市场塑造更具竞争力的形象。▼11月1日,在2023 vivo开发者大会上,vivo正式发布全新手机操作系统。

2024-06-21 15:36:02 387

原创 AI大模型填报高考志愿靠谱吗?AI自己说:完全靠我不行

人们常说,“高考七分报,三分考”。AI大模型填报高考志愿主要是基于大数据和AI技术,通过收集历年高考数据、学校录取情况、招生人数等信息,结合考生的成绩、位次、兴趣等因素,为考生提供智能化的志愿填报建议。在高考志愿填报中,考生和家长在利用AI推荐的同时,还要结合自身的实际情况、兴趣爱好、职业规划以及咨询有经验的老师和专业人士的意见,做出更加全面和理性的决策。总结上述大模型产品的回答,在高考志愿填报中,AI大模型的优势主要在于:可以在短时间内处理大量数据,根据考生的成绩、兴趣和意向,提供个性化的志愿填报方案。

2024-06-21 15:34:06 837

原创 从数据到生成式AI,是该重新思考风险的时候了

OpenAI“宫斗”大戏即将尘埃落定。自首席执行官Sam Altman突然被董事会宣布遭解雇、董事长兼总裁Greg Brockman辞职;紧接着OpenAI员工以辞职威胁董事会要求Altman回归;再到OpenAI董事会更换成员、Altman回归OpenAI。表面上看,这似乎是一场针对一家独领风骚的技术初创公司控制权的争夺战,但从种种迹象来看,此次“宫斗”的导火索,更多应源自对AI未来发展理念的分歧:一派扛着“加速主义”旗帜,希望AI在技术精英的带领下加速前进改造世界;

2024-06-19 11:27:07 903

原创 真正开源才是大模型的未来?

当然,无论是开源还是闭源,重要的是持续创新、提升透明度和安全性,以及实现AI技术的社会价值和经济价值的最大化。比起断定谁会是大模型的未来,不如去关注如何合理利用这两种模式,去塑造一个更加智能、开放、安全和可持续的AI未来。

2024-06-19 10:30:51 948

原创 2024 AI大模型 常问的问题以及答案(附最新的AI大模型面试大厂题 )

在2024年AI大模型的面试中,常问的问题以及答案可能会涵盖多个方面,包括AI大模型的基础知识、训练过程、应用、挑战和前沿趋势等。由于我无法直接附上174题的完整面试题库及其答案,我将基于提供的信息和当前AI大模型领域的热点,给出一些常见的问题和答案示例。

2024-06-19 10:23:08 1673

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除