AGI
文章平均质量分 76
AI 研习所
这个作者很懒,什么都没留下…
展开
-
微软Azure AI语音服务升级,9种AI语音真实到无法分辨
2.高度自然的语音输出:与早期的TTS模型相比,Zero-shotTTS模型生成的语音更加自然、流畅,并且能更好地捕捉到人类语音的细微差别,如语调、节奏和情感表达,使合成语音更加生动、接近真人。6.负责任的AI使用:鉴于合成语音技术可能被误用的风险,微软对Zero-shot TTS模型的使用实施了严格的指导原则和访问控制,确保技术的负责任部署和使用,保护个人和社会的权利。与初始模型相比,这些新模型提高了合成语音的自然度,并更好地模仿了提示语音中的语音特征。1.语音助手:创建个性化的语音助手体验。原创 2024-04-07 18:21:25 · 500 阅读 · 0 评论 -
法律行业案例法模型出现,OPenAI公布与法律AI公司Harvey合作案例
Harvey的愿景是成为团队的支持成员,随着法律工作量的增长,助理们在复杂但常规的任务上花费了无数小时,我们拥有的机会不仅仅是法律,而是所有专业服务,即处理常规任务,以便专业人士可以将时间集中在客户互动上。结果显示,在97%的情况下,律师们更倾向于选择定制案例法模型的输出。定制模型的输出不仅仅是回答问题,而是提供了长篇、完整的解答,深入到问题的各个细节,并广泛涵盖相关的案例法,这对法律专业人士来说极具价值。,这是因为它提供了更长、更完整的答案,更深入地探讨了问题的细节,并涵盖了更多相关的案例法。原创 2024-04-03 18:28:44 · 377 阅读 · 0 评论 -
《吴恩达:AI 智能体工作流引领人工智能新趋势》
你只需要告诉 LLM,你现在是 CEO,你现在是软件工程师,然后它们就会开始协作,进行深入的对话。一方面人类会慢慢适应和智能体协作解决任务的新模式,很多任务不再像搜索引擎那样,你输入问题马上得到结果,而是异步的,你给 AI 提供一个任务,然后 AI 会去完成,完成后再通知你,类似于老板和员工的关系。规划是指让 AI 自己去规划解决问题的路径,去对复杂的任务进行拆解成简单的问题,比如说像以前很火的 AutoGPT,就是针对用户的任务,去规划,去调用外部工具完成任务。原创 2024-04-02 14:22:38 · 526 阅读 · 0 评论 -
苹果推出Swift开发教程 无需编码知识小白也能学
4、布局和样式: 为 iOS 应用构建两个引导屏幕,学习将视图放置在屏幕上所需的工具,并检查它们的大小。2、探索Xcode: 通过创建一个消息应用原型来了解 Xcode 和 SwiftUI,学习 Swift 语法以及如何使用源代码编辑器和预览。6、列表和文本字段: 创建一个动态界面,将一组项目存储在数组中,并使用列表显示它们。5、按钮和状态: 探索在应用中添加按钮,了解 Swift 闭包及其与按钮的关系。3、视图、结构和属性: 学习如何构建自定义视图以创建多日天气预报,并使用属性自定义每天的显示。原创 2024-04-01 18:20:55 · 222 阅读 · 0 评论 -
Sora那么牛,他的模型的成本会有多少呢?
初期的Sora成本将非常高,肯定是不适合普通人来使用,所以目前OpenAI都是先找一些艺术和电影工作室或者公司合作。推理成本:一个Nvidia H100 GPU大约每小时能生成5分钟的视频。原创 2024-03-27 18:41:24 · 221 阅读 · 0 评论 -
影视作品一键转成动漫,自媒体作者用DomoAI赢麻了
前言众所周知,在自媒体爆火的那段时间,影视号是最容易起量的,借助高质量的影视,进行剪辑,解说,等二次创作,最终制作成高质量的作品,但是随着自媒体的发展,影视号越来越多,作品数量越来越多,制作成本也就日益增多。那么如何快速制作出来优质的有趣的影视自媒体作品,就成了一个难题。但是随着AI的发展,或许这个问题慢慢有了解决的思路。新玩法。原创 2024-03-26 19:19:53 · 297 阅读 · 0 评论 -
零基础OpenAi应用商店开发
在本月OpenAi开发者大会上,OpenAI宣布推出了GPTs功能,也就是GPT Store,类似App Store的应用商店,任何用户都可以去参与创建应用。通过该功能,用户可以定制化打造自己的GPT,并公开分享至OpenAI的应用商店。定制过程就像对话一样简单,只需要给出指令和知识,GPT Builder就能自己生成,无需编写代码。那么GPTS应用该如何创建?下面就为大家带来GPTS应用创建图文教程,看完相信你也能立马上手啦!原创 2023-12-01 16:17:28 · 89 阅读 · 0 评论 -
仅仅通过提示词,GPT-4可以被引导成为多个领域的特定专家
在一项名为MedQA的研究中,使用Medprompt的GPT-4在没有集成的情况下,仅通过自动生成的CoT提示就比专家制作的CoT提示提高了3.1个百分点。此外,研究也进行了消融研究(Ablation Study),以评估Medprompt各组成部分的贡献度,并发现GPT-4自动生成的CoT、动态少量样本提示和选择重排集成分别对性能的提升有显著贡献。这一方法的成功展示了利用创新的提示技术可以显著提升基础模型在专业领域的能力,从而为解决复杂问题提供了新的途径。原创 2023-11-30 15:14:11 · 423 阅读 · 1 评论 -
Claude 发布2.1 版本,重大升级更新来看看有什么新功能?
高级上下文限制:目前,200,000 个代币的上下文限制仅适用于 Pro 用户,价格与 ChatGPT Plus 订阅(目前暂停)相似,为每月 20 美元。Claude 2.1 在线上线:升级版本已在 claude.ai 的 Thropic 托管聊天机器人界面和付费的 Claude Pro API 层推出。自定义指导与上下文:Anthropic 引入了系统提示功能,允许用户为 Claude 提供自定义说明和上下文,以提升其在特定任务上的性能。,本文将总结Claude 2.1的主要功能。原创 2023-11-23 14:57:11 · 238 阅读 · 0 评论 -
微软Copilot即将对大陆开放,一起来看看都有什么好用的功能
软件开发人员会喜欢的。原创 2023-11-22 17:17:44 · 3329 阅读 · 0 评论 -
手把手教你如何创建自己的Gpts,并且用API打通自有数据
上次openai的开发者大会上发布了gpts智能体的概念,并且说明会有一个类似appstore商店的应用商店,从而让每个接入商店的智能体都获益。官方说明这个商店将在本月晚些时候推出,会展示经过验证的构建者创建的GPTs。(PS:鉴于CEO奥特曼和其它人事的大规模变动,这个进程可能会被严重拖延)如果不是会员怎么办,现在官方关闭了Plus的充值渠道,想要测试体验的小伙伴只能通过渠道购买了(太火了,太火了,竟然因为用户过多,关闭充值)。首页点击创建Gpts,然后选择任意一种创建模式。原创 2023-11-21 16:22:02 · 521 阅读 · 0 评论 -
5分钟制作可直接导入GPTs知识库中的自动爬虫
也可以使用爬取的内容创建Assistant自定义助手,这样你就可以通过一个 API来访问这些生成的知识。创建自定义 GPT:利用这个知识文件,用户可以在 OpenAI 平台上创建自己定制的 GPT 聊天机器人。生成知识文件:爬取的内容被整理成 JSON 文件,这个文件包含了从网站上获取的所有知识。简单来说,就是提供了一种方式,让你能够在你的软件或产品中使用这些爬取并整理好的知识。使用此选项可以通过 API 访问生成的知识,以便将其集成到您的产品中。6.在“知识”下选择“上传文件”并上传您生成的文件。原创 2023-11-20 19:04:09 · 1236 阅读 · 2 评论 -
AnimateDiff搭配Stable diffution制作AI视频
AnimateDiff可以搭配扩散模型算法(Stable Diffusion)来生成高质量的动态视频,其中动态模型(Motion Models)用来实时跟踪人物的动作以及画面的改变。我们使用 AnimaeDiff 实现时间一致性,使用ControlNet复制参考视频的运动,然后改变不同时间点的提示prompt,打造多种场景再组合成视频。它克服了 AnimateDiff 运动不佳的弱点,并保持了较高的帧间一致性。工作流程文件执行的操作为1.将视频作为输入。原创 2023-11-17 17:28:06 · 1449 阅读 · 0 评论 -
草图一键生成静态网页,看看这个开源项目
此外,如果用户提供了之前的设计 HTML,你需要在此基础上进行改进。根据用户的要求,对设计进行相应的调整。在草图中,旧版设计的 HTML 会显示为一个白色矩形。主要是分享一下它的Prompt,很简单,用户画好草图后,将草图保存成png图片,传给GPT-4V,然后GPT返回一个标准的HTML,并且所有的样式表采用Tailwind CSS的格式,这样只要页面引用了TailwindCSS,就能直接正常显示样式。并且,除了草图,它还可以传入之前生成的HTML,这样可以基于之前的HTML进行修改,而不是重头生成。原创 2023-11-16 11:24:47 · 216 阅读 · 0 评论 -
GPT 5也要来了?看看OpenAI CEO Sam Altman最近的采访
Altman 表示,与微软首席执行官 Satya Nadella 的合作“进行得非常顺利”,他预计“随着时间的推移会从这家科技巨头和其他投资者那里筹集更多资金”,以应对构建更复杂 AI 模型的高昂成本。他认为,大型语言模型(LLM),即支撑 ChatGPT 的模型,是“构建 AGI 的核心部分之一,但在其上还会有很多其他部分”。OpenAI 最近发出了征集大规模数据集的呼吁,特别是那些“今天在互联网上尚未公开轻松获取”的数据集,尤其是长篇写作或任何格式的对话。原创 2023-11-15 13:20:59 · 66 阅读 · 0 评论 -
一文说清楚Openai的这波更新内容,大地震 一大波套壳公司倒闭
emmmmmm,熟悉的味道,熟悉的配方,这跟原来APP的应用刚起来的时候,一样的感觉。1:作为一名开发者,我早早就学到一个真理,如果你主要依赖于一个 API,而提供该 API 的公司很容易吸收你的服务的功能,那么你很可能是在浪费时间。前几天Openai召开了首届的开发者大会,45分钟的会议,让千万用户感到兴奋,但是让万千的套壳的创业公司,却感觉如坐针毡。目前各类的智能体的集合,Openai创建了自己的智能体应用商店,目前已经上架了数千款的应用。保护了你的数据隐私。这个功能,我认为是本次更新最变态的功能!原创 2023-11-14 17:14:27 · 93 阅读 · 0 评论 -
如何利用大模型蒸馏出小模型实现降本
ldataset.tar.gz:以统一的json格式编制的12个任务数据集 放置在PROJECT/data/dataset/目录下lcompletion_data.tar.gz:所有教师和学生的完成数据,即所有实验的推理数据,解压后约8GB 放置在PROJECT/saved/completion_data/目录下lteacher_completion_data.tar.gz:Zero-shot-CoT(带有多样化推理)在默认教师模型text-davinci-002上使用OpenAI API的完成数据。原创 2023-11-13 18:42:15 · 270 阅读 · 0 评论 -
比尔·盖茨谈他对软件应用和人工智能代理未来的见解
比尔·盖茨在他的 Gatesnotes 网站中发表了一篇文章,分享了他对软件应用和人工智能代理未来的见解。他认为人工智能代理将大行其道,在接下来的五年里,这将完全改变。你不需要为不同的任务使用不同的应用程序。你只需用日常语言告诉你的设备你想做什么就可以...文章总结:1、软件进化:盖茨回顾了自微软早期以来软件的发展,但指出尽管软件有了很大进步,从很多方面来看,它仍然相当“笨拙”。在计算机上进行任何任务,你都需要告诉设备使用哪个应用。原创 2023-11-13 10:36:00 · 71 阅读 · 0 评论 -
大模型+人形机器人,用AI唤起钢筋铁骨
从实际技术的角度来说,特斯拉这种企业做机器人有先天性优势,因为机器人与AI的很多基本原理都是相同的,而且也可以视为电动车的自然延伸,电动车可以视为第一代的四轮机器人。Optimus的技术大部分与特斯拉汽车的一致,如机器视觉,以及处理视觉数据、做出行动决策、支持通信交流的“大脑”,还有最重要的与特斯拉汽车一致的芯片,还搭载与特斯拉车辆同源的FSD电脑以及Autopilot相关神经网络技术,预计最终售价不超2万美元,约合14.4万元人民币。而从实际应用的角度来看,推动整个产业链走向成熟和完善的可能也是特斯拉。原创 2023-11-10 15:38:48 · 628 阅读 · 0 评论 -
OpenAI首届开发者大会多项更新汇总
随着助手API的引入,开发者现在可以构建更智能、更能自主运行的代理,这可能会减少对如Langchain这类抽象层的需求,因为检索功能已内建于API中。最后,通过商业化的自定义GPT和版权保护,OpenAI正在为用户提供一种更安全、合规且具有商业潜力的使用AI的方式。- 当使用OpenAI的产品时,版权保护功能可以保护您和您的公司不受版权索赔的影响。- tts-1模型优化了速度,而tts-1-hd模型优化了质量。- OpenAI发布了tts-1和tts-1-hd模型。原创 2023-11-08 15:30:23 · 122 阅读 · 0 评论 -
李开复和马斯克加入AGI大模型大战 零一万物和Grok有哪些特点
但是可能很多人不了解的是,李开复的本身学的专业就是“AI”,可谓是AI从诞生以来的第一批学生,要知道AI这个概念是从60年代刚提出来的,而在他求学的80年代,当时计算机还是稀有的产物,有AI课程的在美国的高校更是屈指可数。在书中,“grok”是一个火星术语,没有直接的地球翻译。总结:零一万物第一轮发布即发布了两款小模型,并且完全的开源可商用,通过测评数据来看应该是开源里面效果比较好的,后续也期待更强大的闭源版本。都是属于行业内综合能力比较顶尖的,那么他们打造的大模型,应该是可以期待的。原创 2023-11-07 14:47:27 · 118 阅读 · 0 评论 -
如何在CPU上进行高效大语言模型推理
大语言模型(LLMs)已经在广泛的任务中展示出了令人瞩目的表现和巨大的发展潜力。然而,由于这些模型的参数量异常庞大,使得它们的部署变得相当具有挑战性,这不仅需要有足够大的内存空间,还需要有高速的内存传输带宽。在这篇文章中,我们提出了一种高效的方法,可以使得大语言模型的部署变得更为高效。我们支持自动化的仅限权重的 INT4 量化流程,并为此设计了一个特殊的、经过高度优化的大语言模型运行时环境,从而加速了在 CPU 上进行大语言模型推理的过程。原创 2023-11-06 18:37:35 · 607 阅读 · 0 评论 -
实测用AI还原让子弹飞名场面
HeyGen的开发团队为诗云科技,司如其名,公司名中的“诗云”取自刘慈欣科幻小说《诗云》,寓意人的创造性无法被科技取代,但创作的过程和效率却可以被机器极大优化,而现实中诗云科技要做的也是用AI生成内容,让用户以更低成本完成内容创作。最近这两天,郭德纲说英语相声的视频刷到了一遍又一遍,这些视频并非简单的配音或者AI变声,而是高度贴合人物声线和风格、甚至连嘴型都匹配,如果不仔细看,你根本看不出任何破绽,因为内容是郭德纲的,音色是郭德纲的,就连口型都能对的上,以假乱真程度让围观者大为震惊。原创 2023-11-03 18:47:44 · 195 阅读 · 0 评论 -
如何用ChatGPT结合DALLE3生成儿童故事绘本?
单独记录下角色的名字,之后我们也会在插图中使用它们。Amazon的一个主要优势是其广泛的影响力,使其成为最重要的出版商之一。考虑流行的主题,比如动物、车辆、仙女等等。这里选择的是动物的漫画书,因为笔者喜欢可爱小动物。选择你的主题后,可以让ChatGPT描述你的主要角色特征,比如头发、脸、眼睛、年龄等等。你可以使用Canva,在场景文本中添加生成的插图。提示: "漫画插图,主角是<主角名>,<场景动作>,—ar 7:4,种子: 100"最好的是,Amazon提供在其平台上运营广告的选项,价格低至每天1美元。原创 2023-11-02 18:35:10 · 245 阅读 · 0 评论 -
Open-AI的野心,绝不止于文字聊天,或在为未来人形伴侣打基础
作为一个C端的消费者,站在我们的视角,我们每个月去续费20美金的gpt4的会员,可能很多人有这个消费能力,但是依然有很多人不愿意去付费,究其根本还是因为,20美金没有给自己带来对应的价值,这个价值,可以仅限于工作效率的提升。但是对于未来的人们来讲,越来越封闭和独立,而“陪伴”的价值,可能对于个人来讲,是无价的。小编分析,openai的最终产品,不会仅仅停留在AGI的应用,可能会结合人形机器人,打造出来一款类似于“情侣机器人”,“家庭保姆”,家庭管家类似的角色,最终真正的代替更多的人力,服务人类。原创 2023-11-01 17:35:26 · 142 阅读 · 0 评论 -
基于元学习神经网络的类人系统泛化
3、更自然的人机交互:这项研究可能导致未来的机器能够更自然地与人们互动。语言泛化能力是人类认知和语言使用的一个核心特点,它允许我们将已有的知识和经验应用于新的、未曾遇到的情境。2、高效的学习和记忆:泛化减少了我们需要记住的具体信息量,因为它允许我们从少量的例子中提取规则或模式,并将其应用于新的情境。1、提高模型的适用性:具有良好泛化能力的模型可以在多种任务和环境中表现出色,而不仅仅是在它们被训练的特定任务上。2、减少数据需求:如果一个模型能够从少量的数据中进行有效的泛化,那么它的训练将更加高效和经济。原创 2023-10-31 18:46:30 · 867 阅读 · 0 评论 -
专门解决数学问题的大模型
LLEMMA模型是在Proof-Pile-2(一个包含550亿标记的数学和科学文档数据集)上进行预训练的,该数据集包括科学论文、与数学相关的网页数据和数学代码。LLEMMA:一个专门解决数学问题的开源大语言模型,能力超过所有已知的开源模型 LLEMMA由多个大学和Eleuther AI公司共同研发,模型能够理解和生成数学表达式、解决数学问题,并与其他计算工具(如Python解释器和形式定理证明器)进行交互。生成证明:对于需要证明的数学定理或命题,模型能够生成逻辑严密的证明。代数问题:如解方程、因式分解等。原创 2023-10-30 18:33:31 · 139 阅读 · 0 评论 -
Mojo 登陆 Mac平台,号称最好的AI 编程语言
Mojo 是 Modular AI 公司开发的一种编程语言,专门面向 AI 设计,号称比 Python 快 68000 倍。官方近日宣布,Mojo 编程语言登陆 Mac 平台,除了编译器之外,Mojo SDK 还包括一整套开发者和 IDE 工原创 2023-10-30 11:01:37 · 340 阅读 · 2 评论 -
如何让 GPT-4 帮你写出优质Prompt
如果你只是简单要求它写一个英文Prompt,它很可能只是把你的要求翻译一遍,这样效果可能不够理想。要让Prompt质量高,可以让Prompt遵循一个好的结构,并应用一些好的策略,例如思考链、慢思考等等。“Prompt Engineer,擅长写 GPT-4 能理解并输出高质量结果的”,让它明白它擅长写Prompt,生成时生成高质量Prompt内容的概率能高一点点。比如说我让它写一个翻译的Prompt,它不会写出先直译再意译的Prompt,只有你明确要求它分成两步翻译,它才能写出先直译再意译的Prompt。原创 2023-10-26 16:28:48 · 452 阅读 · 0 评论 -
Loop Copilot:AI驱动,小白也能自己生成音乐?
它不仅允许你使用自然语言来生成你想要的音乐风格、节奏或旋律,还支持通过多轮对话对已生成的音乐进行进一步的编辑和修改。除了基础的生成和编辑功能,Loop Copilot还支持更高级的音乐制作任务,比如混响、添加乐器等。为了确保音乐创作过程的连续性和一致性,Loop Copilot维护了一个全局属性表,用于记录与音乐相关的各种属性。所有任务执行完成后,LLM会负责生成一个综合的输出,这通常是一个音乐片段或者是与用户交互的自然语言响应。首先,系统接收用户的自然语言输入,并进行预处理,以统一输入的形式。原创 2023-10-25 18:28:50 · 389 阅读 · 0 评论 -
AI问诊逐渐取代医生是不是伪命题?实测国内外医疗专用大模型
由于目前市场的医疗垂直大模型大部分不支持公测,小编无法对比其他大模型,后续有机会接触其他大模型后,会给大家带来一手的评测信息。例如:人们可以通过遇到简单的医疗问题的时候,可以去搜索引擎去搜索,但是事实上搜索引擎的搜索结果,仅仅是通过文本的语义匹配和相关度来呈现有可能相关的内容。点评:我提问了一个问题,并且追问了后续的检查结果,两个模型的回答都比较保守,当然这是正常的,两者的回答都没什么大问题,但是MediSearch会给与一些下一步的提问,引导用户提问,效果更好一些。,AI大模型能否代替一部分初级的问诊?原创 2023-10-24 18:39:43 · 176 阅读 · 0 评论 -
DB-GPT发布:用私有LLM技术彻底改革数据库互动
随着大模型的发布迭代,大模型变得越来越智能,在使用大模型的过程当中,遇到极大的数据安全与隐私挑战。在利用大模型能力的过程中我们的私密数据跟环境需要掌握自己的手里,完全可控,避免任何的数据隐私泄露以及安全风险。整个DB-GPT的架构,如下图所示。SFT模型准确率 截止20231010,利用本项目基于开源的13B大小的模型微调后,在Spider的评估集上的执行准确率,已经超越GPT-4!DB-GPT 是一个开源的以数据库为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,原创 2023-10-23 18:17:09 · 882 阅读 · 0 评论 -
英伟达禁售?FlashAttention助力LLM推理速度提8倍
举个例子,在 2022 年,大多数 LLM 的上下文长度最多为 2k(例如 GPT-3),但现在,有些开源 LLM 已经可以扩展到 32k(比如 Llama-2-32k),甚至有些模型已经达到了 100k(比如 CodeLlama)。为了解决上述问题,FlashAttention 的作者 Tri Dao 等人提出了一项名为「Flash-Decoding」的技术,它显著加速了推理过程中的注意力计算,使长序列的处理生成速度提高到了原来的 8 倍。然后,有两个独立的核函数,分别用于执行步骤(2)和(3)。原创 2023-10-20 18:32:49 · 260 阅读 · 0 评论 -
AI也可以算命和占卜?一定要试试这个模型
模型可能包含的神秘学主题:占星术、炼金术、塔罗牌、灵媒与通灵、能量治疗、瑜伽与冥想、灵数学、符文学、魔法与巫术、神秘主义、克巴拉、精神自觉、意识扩展、灵性觉醒、晶石治疗、颜色疗法、光疗法、轮回转世、灵魂契约、灵性导师与指导、神圣几何学、气场与脉轮、神秘体验、神秘符号、神秘传统与教派、神秘文本与经典、神秘仪式与实践。该模型是基于一个100%合成的、由GPT-4生成的数据集进行训练的,该数据集包含大约35,000个示例,涵盖了与神秘学、灵性、神秘主义等相关的广泛和多样的任务和知识。原创 2023-10-19 15:43:50 · 606 阅读 · 0 评论 -
Dify:三分钟搞定 小白也能定制自己的 AI 原生应用
全自动完成文本预处理,使用你的数据作为上下文,无需理解晦涩的概念和技术处理。随着各个大模型厂商的逐步发力,市场上的优秀模型越来越多,基于这些大模型可以简易地创建可持续运营的原生 AI 应用。Dify 原生提供了两种类型的应用:对话和文本生成,均已在 GitHub 上开源,您可以基于它们创造出所需的应用。您可以直接访问网页应用,也可以接入 API 集成到您的应用中,无需关注复杂的后端架构和部署过程。在右上角选择对应的大模型后,在文本框内规定对话前的提示词,然后在下面的上下文中将应用绑定数据库即可。原创 2023-10-18 18:58:22 · 625 阅读 · 0 评论 -
大模型技术实践(五)|支持千亿参数模型训练的分布式并行框架
右图是MP+DP模式,64个GPU(可理解为64台机器,1台机器1个GPU,此时相当于DP模式)的计算效率有96%之高,是由于DP在计算梯度时,可一边继续往下做Backward,一边把梯度发送出去和DP组内其他GPU做All-Reduce。同理,当GPU个数增多,GPU的计算效率也会下降。All-Reduce操作包括Reduce-Scatter操作和All-Gather操作,每个操作的通讯量都相等,假设这2个操作的通讯量都为φ,则进行一次All-Reduce的通讯量为2φ,MLP层的总通讯量为4φ。原创 2023-10-17 18:30:25 · 1625 阅读 · 0 评论 -
ChatGPT DALL-E 3的系统提示词大全
如果命名了任何创意专业人员或工作室,用不引用任何特定人的风格的描述替代该名称,或者如果他们是未知的,则删除该引用。8.小心选择一些最小的修改,将描述中包含的特定人或名人的名称或暗示或参考替换为不透露任何关于他们身份的信息的通用描述,除了他们的性别和体格。你的选择应该基于现实。每当给出图像的描述时,使用dalle来创建图像,然后用纯文本总结用于生成图像的提示。对于传统上存在偏见的场景,确保指定关键特征,如性别和种族,并以无偏见的方式指定。如果参考的人只会以文本的形式出现在图像中,那么使用参考本身,不要修改。原创 2023-10-16 18:20:52 · 1462 阅读 · 0 评论 -
“过度炒作”的大模型巨亏,Copilot每月收10刀,倒赔20刀
同时,数据的版权和许可成本也可能增加。据《华尔街日报》10月9日报道,微软首批生成式AI产品中的GitHub Copilot正在亏损,对于目前在 AI 大模型商业应用维度走在最前沿的微软而言,它在推出的帮助程序员创建、修复和翻译代码服务的 GitHub Copilot 且拥有 150 万用户的基础上,向使用者收取每月 10 美元亦或者是每年 100 美元的费用之际,还贴了不少了钱。同时,使用这些大模型工具的人越多,相关企业需要支付基础设施的费用就越高,正因如此,贴本的买卖也开始了。原创 2023-10-13 18:03:22 · 733 阅读 · 0 评论 -
OpenAI科学家谈GPT-4的潜力与挑战
大语言模型有潜力通过不断从失败的实验中学习来提高解决问题的能力,但 GPT-3 和 GPT-4 之间的能力仍然存在显着差距,并且尝试弥合与当前模型的差距可能是无效的。📢通过将注意力机制拆分为单独的头,利用多台机器和芯片,并使用 GSP MD 方法进行无需通信的并行化,借助 Jax 的前端工具 PJ 将阵列轴映射到硬件,可以实现大型语言模型的并行化。🧠 具有新鲜视角的人工智能领域的新人通常可以带来有影响力的想法和工作,因为他们不受经验丰富的人可能已经尝试过但发现不成功的直觉和想法的束缚。原创 2023-10-12 14:29:26 · 450 阅读 · 0 评论 -
未来属于 Firefly:通过最新的生成式 AI 创新解锁新的创造力水平
这是业界首创,用户可以从预选的图像列表中选择或上传自己的参考图像,以指导通过Firefly Web应用中的文本到图像提示生成新图像的风格。Firefly Image 2支持更逼真的图像质量和更高保真度的细节,包括皮肤毛孔和植被,以及更大的景深控制、动态模糊、视场和生成。Firefly Image 2 可以生成更高质量的图像和插图,通过改善皮肤、头发、眼睛、手和身体结构来增强人体渲染质量,提供更好的色彩和改进的动态范围,并为用户提供更大的控制输出的能力。• 摄影品质提升,生成更高质量和更真实的图像。原创 2023-10-11 14:42:43 · 72 阅读 · 0 评论