AI人工智能
文章平均质量分 76
AI人工智能
sam5198
一个技术码农,分享自己的一些职场收获,技术内容
展开
-
GPT一键化身「AI助理」——自定义指令功能
最近GPT又更新了一个超实用的功能——自定义指令,启用后,你可以给GPT设置一些固定指令,让它记住或扮演某个角色,比如客服、律师、投资管理师、老师、营养师......接下来,再次点击个人信息,找到定制说明(Custom instructions),到这里,就可以设置你的专属自定义指令了。3)让它扮演营养师,推荐适合的购物清单对话测试除了这些,像我们之前给大家分享的一些超级指令,现在可以直接预设给GPT了。除了新增自定义指令这个功能之外,自下周开始,GPT-4的消息发送数量将翻一倍,提升到50次/3小时。原创 2023-07-26 10:13:40 · 2714 阅读 · 0 评论 -
OpenAI推动人工智能治理向前发展
他们承诺建立或加入一个论坛或机制,通过该论坛或机制,他们可以开发、推进和采用前沿人工智能安全的共享标准和最佳实践,如NIST人工智能风险管理框架或与红队、安全和社会风险相关的未来标准。这些报告应包括进行的安全评估(包括在危险能力等领域,只要这些评估有责任公开披露),对适当使用领域有影响的绩效的重大限制,讨论模型对公平性和偏见等社会风险的影响,以及为评估模型的部署适宜性而进行的对抗性测试的结果。作为我们建立安全和有益的AGI的使命的一部分,我们将继续试点和完善具体治理实践,专门针对我们生产的高性能基础模型。原创 2023-07-25 11:53:15 · 326 阅读 · 0 评论 -
用人类意识加持的AI加速科学发展,xAI目标的可行性报告
为了生成每个随机游走序列,模型 (i) 以一个有价值的属性(例如铁电性)作为序列中的第一个节点开始游走,(ii) 随机选择提到该属性的一篇文章(超边),(iii) 从那篇文章中随机选择一个材料或作者作为下一个节点,然后通过随机选择与新选择的材料或作者有关的另一篇文章开始第二步,并重复这个马尔可夫过程 (Markov process)预定次数。对于前面提到的所有三种电化学特性、COVID-19疗法和疫苗,以及上面考虑的100种疾病中的大多数,研究发现日期和专家密度之间的相关性是负的、显著的和实质性的。原创 2023-07-24 14:42:27 · 287 阅读 · 1 评论 -
为什么AI工程师现在开始崛起
从超过2亿美元的庞然大物Langchain,到由Nvidia支持的Voyager,显示了代码生成和重用的不可置疑的重要性(我最近参加了与Harrison举行的链式应用与自主智能体的网络研讨会,在那里我扩展了代码核心与LLM核心应用的论点)。6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了“软件2.0” - 将精确建模逻辑的“经典栈”手工编码编程语言与“机器学习”神经网络的新栈进行对比,后者近似逻辑,使软件能够解决比人类能够建模的问题更多。,实际上提供了“AI研究即服务”的API。原创 2023-07-22 09:15:31 · 103 阅读 · 0 评论 -
大语言模型
这些嵌入捕获了词之间的语义关系,语义相似的词在嵌入空间中位置邻近。此外,角色的Diffusion模型允许用户通过Stable Diffusion的图片到图片过程,创建一个基于自己外观的南方公园角色,并作为平等参与的智能体加入模拟。由于大多数南方公园剧集的转录是GPT-4训练数据集的一部分,它已经对角色的个性、谈话风格以及节目的整体幽默感有很好的把握,无需再进行定制微调。不连续任务的例子有,需要开创性的观点或创造性应用公式的数学问题,撰写笑话或谜语,想出科学假说或哲学论点,或开拓出一种新的写作流派或风格。原创 2023-07-22 09:12:50 · 571 阅读 · 0 评论 -
ChatGPT开放自定义系统级别的指令,可设置偏好变成专属助理
我们可能会使用您的自定义说明来提高用户的模型性能,但您可以通过数据控件禁用此功能。通过与22个国家的用户的对话,我们加深了对可转向性在使我们的模型有效反映每个人的不同背景和独特需求方面所起重要作用的理解。例如,如果您在说明中指定您居住的城市,并使用帮助您预订餐厅的插件,则该模型在调用插件时可能包括您的城市。OpenAI为其大型语言模型接口ChatGPT引入了自定义指令,旨在为用户提供更加量身定制和个性化的体验,可以设置您的偏好,ChatGPT将在未来的所有对话中记住它们。OpenAI官方消息。原创 2023-07-21 11:13:07 · 456 阅读 · 0 评论 -
谁是Al生成内容的作者?从法律视角的探讨
然而,随着人工智能技术的发展,相关的法律规定可能会发生变化。另一方面,人工智能的开发者或使用者可能会主张他们是这些内容的作者,人工智能的开发者可能会主张他们拥有这些内容的版权,因为他们创建了生成这些内容的算法和模型。在版权法中,作者通常被定义为作品的创造者,是作品的原始所有者,并享有对作品的各种权利。一方面,人工智能是生成这些内容的工具,但它既不是自然人,也不是法人,因此在现行的《著作权法》体系下,人工智能难以被视为作者。人工智能是一种工具,它可以根据预设的算法和模型,以及输入的数据,生成各种内容。原创 2023-07-20 08:59:54 · 162 阅读 · 0 评论 -
650亿参数大模型预训练方案开源可商用,LLaMA训练加速38%
650亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升38%。这就是由Colossal-AI最新发布的类LLaMA基础大模型预训练方案。要知道,在“百模大战”背景下,谁拥有自家大模型,往往被视为核心竞争力。在这个节点下,愿意开源大模型的公司少之又少。但自己从头训练一个大模型,对技术、资金都有很高要求。由此,Colossal-AI最新的开源动作,可以说是应时势所需了。并且它还不限制商业使用,开箱即用仅需4步。具体项目有哪些内容?一起往下看~原创 2023-07-20 08:55:36 · 346 阅读 · 0 评论 -
OpenAI科学家Jason Wei关于人工智能的回复
原因是,当你处于能力的边缘时,学习会发生得最快,而由于(2)和(3)是为你量身定做的,它们会让你的学习速度更快。我认为我从研究中学到的最多的就是做研究,而达特茅斯的一个好处就是教授们会尽量抽出时间来指导你或对你的工作给予反馈,即使他们并不是你想研究的领域的专家。我个人的观点是,从事自己喜欢的研究非常重要,因为从长远来看,你会做得更好。很难说多学数学不好,但我是这么认为的(这只是我的观点):在深度学习的历史上,有两件简单的事情经受住了时间的考验,而且几乎总是有效:更大的模型和更多的数据。我想我理解你的感受。原创 2023-07-19 10:06:04 · 243 阅读 · 0 评论 -
Wix推出AI生成式工具
Newsguard是一家提供审查新闻来源工具的公司,已经曝光了数百个广告支持的网站,这些网站的名称听起来通用,其名称以生成人工智能创建的错误信息为特色。查找创意机构的目录Top Design Firms在2022年进行的一项调查发现,近27%的小企业仍然没有网站,低流量,随后添加“高级”功能和成本,是他们网站面临的首要挑战。Abrahami说:“人工智能网站生成器利用我们的领域专业知识和近十年的人工智能经验来调整模型,以生成高质量的内容、量身定制的设计和布局。即使是以最佳意图使用的生成人工智能也会出错。原创 2023-07-19 08:41:58 · 132 阅读 · 0 评论 -
中国开源大模型们纷纷商用免费,这步走对了
而商业可用开源可以让国产模型进一步摆脱只论benchmark评分的阶段,进入了是骡子是马拉出来溜溜的阶段,真正的具体的不同的场景,到底推理表现如何,灾难遗忘的问题如何解决,现实环境数据飞轮启动以后是否能提速追逐,将是每个人都能实实在在看到的。于是,当闭源的模型与开源生态注定会越来越多的在解决同样的问题时,闭源用一种大力出奇迹的方式证明路线可能性和天花板之后,开源会真正把它变得易用和可用,在大模型的技术原理越来越没有秘密的趋势下,开源的吸引力会继续变强。尤其是,它还可以实时整合许多最新的、多样化的知识。原创 2023-07-18 09:03:22 · 178 阅读 · 0 评论 -
人工智能系统将家用机器人的解决问题技能提高了80%
因为每个人的家都是不同的,机器人应该是适应性强的问题解决者,而不仅仅是食谱的追随者。在正常情况下,家用机器人遵循预定义的执行任务的配方,这并不总是适合多样化或不断变化的环境。正如麻省理工学院所描述的那样,PIGINet是一个神经网络,它吸收了“计划、图像、目标和初始事实”,然后预测任务计划可以完善以找到可行的运动计划的概率。“我们未来的目标是进一步完善PIGINet,在确定不可行的行动后提出替代任务计划,这将进一步加快可行任务计划的生成,而无需大数据集从头开始培训通用规划师。原创 2023-07-18 08:55:36 · 93 阅读 · 0 评论 -
SepVAE:一种对比VAE,用于将病理模式与健康模式分离开来
对比分析VAE(CA-VAEs)是一类变分自编码器(VAEs),旨在将背景数据集(BG)(即健康受试者)和目标数据集(TG)(即患者)之间的共同变异因素与仅存在于目标数据集中的因素分离开来。关键思路:该方法将潜在空间分为显著特征集(即仅适用于目标数据集)和公共特征集(即存在于两个数据集中)。为了实现这一目标,论文提出了两个关键的规则化损失:在共同表示和显著表示之间的解缠绕项以及在显著空间中的背景和目标样本之间的分类项。相比于当前领域的研究状况,提出了一种新的解决方案,能够更好地区分健康数据与病理数据。原创 2023-07-17 10:07:41 · 209 阅读 · 0 评论 -
AI生成的内容污染互联网,我们该如何拿来写作?
这个问题一方面可以通过给GPT投喂你自己创作的内容来改善,可以使用类似的指令:学习以下的文案的用词、断句、语言、风格、态度。这个问题是注定会出现的,因为从源头去看,Al的训练源于大量的文本数据,这就意味着Al所产生的内容的准确性和质量,至多只能达到其训练数据的平均水平。在实践中,你应当将AI视为一种辅助工具,而非完全可靠的信息源,它的主要作用是帮助你提升创作效率,而不是替代人的思考和判断。因为AI并不能理解创作的目标和读者的需求,更重要的,Al写不出带有你人设的东西,这些独特性的内容,还是需要你自己写。原创 2023-07-17 10:06:54 · 247 阅读 · 0 评论 -
GPT-4最新细节曝光:从架构、基础设施、训练数据集、成本、视觉到MoE
一波巨大的模型即将到来。然而,对于给定的分区布局,芯片间通信所需的时间下降得较慢(或根本不下降),因此随着芯片数量的增加,它变得越来越重要,成为一个越来越重要的瓶颈。较小的批量大小通常可以实现较低的延迟,但较小的批量大小也会导致更差的利用率,从而导致每个令牌的总成本(以芯片秒或美元计)更高。令牌到令牌的延迟的普遍变化以及在进行简单的检索任务与更复杂的任务时的差异似乎表明这是可能的,但是变量太多,无法确定。更多的芯片和更高的批量大小是最便宜的,因为它们可以增加利用率,但这也引入了一个第三个变量,即网络时间。原创 2023-07-15 10:36:33 · 208 阅读 · 0 评论 -
生成语言模型真实性评估基准测试数据
生成语言模型的事实性评估基准》 Dor Muhlgay、Ori Ram、Inbal Magar、Yoav Levine、Nir Ratner、Yonatan Belinkov、Omri Abend、Kevin Leyton-Brown、Amnon Shashua、Yoav Shoham 在将语言模型(LM)部署到特定领域之前,重要的是要衡量它在该领域中生成事实不正确信息的倾向。现有的事实生成评估方法仅关注于来自于语言模型本身的事实,因此无法控制评估的事实集,并且可能低估罕见和不太可能的事实。原创 2023-07-15 10:31:46 · 524 阅读 · 0 评论 -
AI 与自动化:更多的自动化,全新的自动化方式?
但如果使用机器制造一双鞋变得更便宜,那么鞋子就会更便宜,更多的人可以买鞋子,他们有更多的钱可以花在除此之外的其他东西上,并且我们会发现我们需要或想要新的东西,并创造新的工作岗位。每一次 ChatGPT 的更新,都会给我们带来大量新的能力,这些能力往往会逐步应用在改变我们现有工作流程上,因此我是比较看好这一波 AI 在自动化(RPA)领域的价值的,不过要将一个新技术真正应用直至取代复杂的工作流程,我觉得还需要不少的时间,但应该是接下来很大的一个机会。实际上,我们仍在探讨争论的问题,但每个人都同意,原创 2023-07-14 13:59:17 · 1997 阅读 · 0 评论 -
AI自媒体的精彩总结
我们可以将AI配置为“热点分析师”,在热点发生后,将事件提供给Al,让它为你找到切入的角度。可以使用类似的【prompt】:请帮我分析某一热点事件,从心理、社会等层面来分析该热点,为我产出三个可以写文章的角度,要求观点鲜明,不用追求客观,一定要有独特的观点。你可以将一篇同行的文章输入到AI,让AI进行总结或者分析,这可以帮助你了解同行的写作风格、观点,甚至找到你可以进行深入研究的点。当然,想要产出优质的内容,几个prompt是远远不够的,还需要不断地微调和训练,反正GPT也不反抗,尽情PUA它就是了。原创 2023-07-14 13:49:05 · 273 阅读 · 0 评论 -
基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化
基于隐空间的扩散模型 (Latent Diffusion Model),是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始,多次去噪,以使之在隐空间里逼近图片的表示。但是,这样的方法不可避免地增加了推理时长,使客户端的体验大打折扣。众所周知,一个好的 GPU 总能有帮助,确实如此,但其损耗大大增加了。就推理而言,在 2023 年上半年 (H1’23),一个好 CPU 实例 (原创 2023-07-13 10:03:36 · 1169 阅读 · 1 评论 -
马斯克在与创业公司OpenAI竞争的新竞标中公布了xAI
现在唯一可以知道的是,现任人工智能安全中心(Center for AI Safety)主任Dan Hendrycks将担任xAI的顾问——人工智能安全中心是一家总部位于旧金山的非营利组织,其宗旨是“减少与人工智能相关的社会风险”。“探索宇宙本质”这个使命,和大部分AI公司都不相同,显示出这可能是一家不走寻常路的公司。xAI在官网里表示,其独立于X Corp(Twitter、特斯拉等公司的母公司),但xAI“将与 X (Twitter)、特斯拉和其他公司密切合作,在实现我们的使命方面取得进展。原创 2023-07-13 10:01:38 · 149 阅读 · 0 评论 -
任务型对话对话策略学习的强化学习方法
类似地,戴氏(Dai et al.)等人虽对对话管理的进展和挑战进行了综述,但由于其研究兴趣的涵盖面广,故其中涉及到有关DPL中RL方法的讨论相当有限。而且,RL对话系统在五个核心的RL要素,即环境、策略、状态、行动和奖励方面通常有不同的设置。在管道途径中,DPL是联系DST模块和NLG模块的中间纽带,直接关系到对话系统的成败,故相当重要。第二种是模组途径:将系统分为四个相互依存的的组成部分:自然语言理解(NLU)、对话状态追踪(DST)、对话策略学习(DPL)和自然语言生成(NLG),如图1所示。原创 2023-07-12 14:59:05 · 264 阅读 · 0 评论 -
Google DeepMind首席执行官Demis Hassabis访谈录
人工智能伴随着挑战和问题,尤其是有一个巨大的组织结构图移动和一系列高风险的决定要做。我很高兴你在这里。让我们从Google DeepMind本身开始。Google DeepMind是谷歌的一个新部分,由谷歌的两个现有部分组成。有谷歌大脑,这是我们熟悉的人工智能团队,因为我们报道了由杰夫·迪恩运营的谷歌。还有DeepMind,这是你创立的公司。你在2014年把它卖给了Alphabet。你在谷歌之外。直到刚才,它还是在控股公司Alphabet结构中作为一家独立的公司运营。从头开始。为什么DeepMind和G原创 2023-07-12 14:54:06 · 202 阅读 · 0 评论 -
如何借助大语言模型编写更好的代码
例如,您可以要求它编写一个排序算法,用Python启动Web服务器的代码,根据数据库模式编写SQL查询,或者生成Matplotlib的数据可视化命令。为此,您可以使用一个新的聊天会话,并在提示中向ChatGPT提供任务的概述、您目前已完成的步骤、您目前已生成的代码以及您希望它遵循的一些一般准则。通过清理之前与LLM的交互中的混乱内容,您提供了一个更清晰的上下文,并提高了模型生成的代码的准确性。一个成功的方法是首先给ChatGPT一个逐步的程序逻辑概述,让它了解您想要编写的程序的逻辑。原创 2023-07-11 16:37:00 · 230 阅读 · 0 评论 -
MOSS-RLHF实现大模型和人类价值观对齐
FudanNLP 团队通过大量、详实工作,设计实验充分探索了大模型 RLHF 的完整工作流程,仔细剖析了 RLHF 中的强化学习 PPO 算法的内部工作原理以及它在整个 RLHF 中的作用,并研究各种优化方法如何影响训练过程。项目主要作者 FudanNLP 组博士生郑锐补充到:"在开展 RLHF 项目的过程中,我们发现 PPO 算法是模型稳定训练的关键,而 RM (reward model) 的质量决定了模型性能的上限,在本次开源的 RM 基础上,我们也将继续努力探索如何构造更高质量的 RM。原创 2023-07-11 16:19:32 · 864 阅读 · 0 评论 -
Monica - ChatGPT侧边栏助手
可以在edge的插件商店直接搜到的一个插件,浏览网页的时候就在页面侧边,很方便随时点开,需要使用邮箱注册,免费用户每天可以提问30次,但GPT-4和联网等功能都需要付费,可以通过邀请免费获得一些ai聊天次数,我的邀请码是:https://monica.im/?并且像Excel-Chatgpt,sql-Chatgpt,Mini-Chatgpt,claude,brad等提供的能力,我们会一直保持关注,或许在将来您也可以在Monica上看到这些功能。作为你的副驾驶,Monica在侧边栏能够回答任何复杂的问题。原创 2023-07-08 09:31:20 · 2127 阅读 · 0 评论 -
一文看懂ChatGPT与存算一体化
ChatGPT开启大模型“军备赛”,存储作为计算机重要组成部分明显受益:ChatGPT开启算力军备赛,大模型参数呈现指数规模,引爆海量算力需求,模型计算量增长速度远超人工智能硬件算力增长速度,同时也对数据传输速度提出了更高的要求。XPU、内存、硬盘组成完整的冯诺依曼体系,以一台通用服务器为例,芯片组+存储的成本约占70%以上,芯片组、内部存储和外部存储是组成核心部件;存储是计算机的重要组成结构,“内存”实为硬盘与CPU之间的中间人,存储可按照介质分类为ROM和RAM两部分。存算一体,后摩尔时代的必原创 2023-07-08 09:07:17 · 328 阅读 · 0 评论 -
Agent System 是什么?
CoT 已经成为提升复杂任务模型性能的标准提示技术,它通过让模型“逐步思考”,利用更多的测试时间,将困难的任务拆解为更小、更简单的步骤。该方法假设特定领域的 PDDL 和适当的规划师可用,可以帮助 Agents 更好地规划和执行任务,提高任务完成的效率和质量。• 反思和细化:Agents 可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并为接下来的行动进行分析、总结和提炼,这种反思和细化可以帮助 Agents 提高自身的智能和适应性,从而提高最终结果的质量。原创 2023-07-06 09:27:26 · 387 阅读 · 0 评论 -
高清还原你大脑中的画面
因此,经过改进的 EEG 特征嵌入可以与 CLIP 的图像和文本嵌入很好地对齐,并更适合于 SD 图像生成,从而提高生成图像的质量。实际上,如图 6 右下角所示,即使在没有预训练的情况下,使用 CLIP 对齐 EEG 特征仍然可以得到合理的结果,这凸显了 CLIP 监督在该方法中的重要性。为了增强 EEG 特征与 Stable Diffusion 的兼容性,研究人员进一步通过在微调过程中减少 EEG 嵌入与 CLIP 图像嵌入之间的距离,进一步对齐了 EEG、文本和图像的嵌入空间。原创 2023-07-05 08:34:26 · 99 阅读 · 0 评论 -
AI绘画结合GPT 把Ai绘画与摄影玩明白
而摄影则需要捕捉现实中的瞬间,尽管后期处理可以改变一些元素,但基本的形象是由被摄物决定的。摄影的出现在19世纪中叶,挑战了绘画作为记录现实的主要方式,推动了艺术家寻找新的创作手法,这就导致了现代艺术的出现。许多摄影师的作品都受到了绘画的影响。特写,快照美学,超高清画面,一个美丽的女孩,18岁,在海边奔跑,蓝天白云,脸上带着微笑,超细节,宾得k1000,体积光,柯达彩色胶片拍摄,摄影师川内凛子 (Rinko kawauchi) 。总的来说,绘画和摄影是两种独特的艺术形式,它们既相互竞争,又相互影响。原创 2023-07-05 08:34:04 · 1656 阅读 · 0 评论 -
Stable Difussion能做什么?
每个词元随后将转换为一个包含768个数值的向量,我们称之为标签(Embedding)(是的,就是那个你在SD GUI工具中所使用的Embedding)。我们为什么需要标签?如果你将降噪强度(denoising strength)设置为1,那你获得的图片其实就等价于纯粹使用文本指令运行文本生成图片工具所得到的结果,因为此时这两种功能使用的初始潜空间图像都是一个完全随机的噪声图。标签的使用是有魔法的。训练的过程也是一样的,训练流程中生成的并不是噪声图像,而是潜空间中的张量(即一个4x64x64的噪声图)。原创 2023-07-04 09:17:28 · 1702 阅读 · 0 评论 -
悟道·天鹰 Aquila + 天秤 FlagEval,打造大模型能力与评测标准双标杆
更多维度的评测数据集也在陆续集成中。天秤(FlagEval)大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用AI方法实现对主观评测的辅助,大幅提升评测的效率和客观性。AquilaCode-7B “文本-代码”生成模型,基于 Aquila-7B 强大的基础模型能力,以小数据集、小参数量,实现高性能,是目前支持中英双语的、性能最好的开源代码模型,经过了高质量过滤、使用有合规开源许可的训练代码数据进行训练。原创 2023-07-04 08:45:25 · 251 阅读 · 0 评论 -
大型语言模型作为属性化训练数据生成器
与此同时,主攻数学问题的 AI 也在不断发展壮大:一个名为 LeanDojo 的开放平台提供了一套基于大型语言模型的开源定理证明器,消除了在机器学习方法用于定理证明时存在的私有代码、数据和大量计算需求等障碍,为机器学习方法在定理证明领域的研究提供了便利。对于给定的分类任务,首先通过LLM的帮助,以交互式、半自动化的方式识别属性维度及其对应的属性值。大型语言模型作为属性化训练数据生成器,提出一种使用多样化属性提示的数据生成方法,可以生成具有多样性和属性的训练数据,从而提高了模型的性能和数据生成的效率。原创 2023-07-02 11:52:17 · 654 阅读 · 0 评论 -
能说会画 VisCPM:SOTA 开源中文多模态大模型
VisCPM 是一个开源的多模态大模型系列,支持中英双语的多模态对话能力(VisCPM-Chat模型)和文到图生成能力(VisCPM-Paint模型)。两个模型在指令精调阶段使用的数据相同,VisCPM-Chat-zhplus 在预训练阶段额外加入了 20M 清洗后的原生中文图文对数据和 120M 翻译到中文的图文对数据。与 VisCPM-Chat 一样,得益于 CPM-Bee 的双语能力,VisCPM-Paint 可以仅通过英文图文对训练,泛化实现良好的中文文到图生成能力,达到中文开源模型的最佳效果。原创 2023-07-02 11:51:55 · 287 阅读 · 0 评论 -
2023年上半年全部是关于人工智能
今年5月,OpenAI首席执行官萨姆·阿尔特曼、微软首席技术官凯文·斯科特以及谷歌DeepMind首席执行官德米斯·哈萨比斯签署了由AI安全中心发起的另一封公开信,其中指出,与大流行等其他灾难一样,利用人工智能来降低灭绝风险应该成为全球的优先事项,同时也应该防止核战争。今年3月,包括特斯拉首席执行官埃隆·马斯克在内的几位人工智能领域的知名人士,签署了一封致未来生命研究所的公开信,呼吁对比GPT-4更强大的AI系统进行为期6个月的培训停止。然而,在人工智能领域,大型科技公司并不是唯一的竞争者。原创 2023-07-01 10:01:56 · 166 阅读 · 0 评论 -
FlagPerf中标准case的定义和添加&适配原则
基本配置: 基本配置是模型训练及运行环境相关的配置参数,主要分为两大类:模型超参(lr等)和训练配置(log_freq等),路径为training/benchmarks/<模型>/<框架>/config/_base.py和mutable_params.py, 其中mutable_params.py 中定义的参数表示可覆盖参数项。随着模型覆盖领域的拓展,我们发现,控制几个小时的收敛时间,并不能保证模型的收敛质量,比如大模型场景,训练几个小时并没有参考意义。基于此,标准case的添加标准在一砖一瓦中慢慢形成。原创 2023-07-01 09:47:58 · 287 阅读 · 0 评论 -
通过无模型多代理强化学习掌握Stratego游戏
目前的工作不仅增加了越来越多的游戏,人工智能系统可以玩得和人类一样好,甚至比人类更好,而且还可能促进强化学习方法在现实世界、大规模多代理问题中的进一步应用,这些问题的特点是信息不完善,因此目前无法解决。目前的工作不仅增加了越来越多的游戏,人工智能系统可以玩得和人类一样好,甚至比人类更好,而且还可能促进强化学习方法在现实世界、大规模多代理问题中的进一步应用,这些问题的特点是信息不完善,因此目前无法解决。我们介绍了DeepNash,一个在人类专家层面玩不完美的信息游戏Stratego的自主代理。原创 2023-06-30 15:03:11 · 474 阅读 · 0 评论 -
Stable Diffusion常用提示词中英文对照表
肖像画(Portraits)——Derek Gores,Miles Aldridge, Jean Baptiste-Carpeaux,Anne-Louis Girodet。HDR,UHD,8K(HDR、UHD、4K、8K和64K)——这样的质量词可以带来巨大的差异提升照片的质量。(EOS R8,50mm,F1.2,8K,RAW photo:1.2)——摄影币对相机设置的描述。Studio lighting——添加演播室的灯光,可以为图像添加一些漂亮的纹理。原创 2023-06-30 09:20:16 · 11554 阅读 · 0 评论 -
微软多模态大模型 Kosmos-2|局部理解能力,解锁实体级交互
那么,KOSMOS-2 是如何诞生的呢?某种程度上说,多模态的大模型的这种能力奠定了通往具身 AI(Embodiment AI)的基础,为真正的多模态——语言、感知、行动与世界的大结合提供了启示,再来看一些例子,当用户输入“左眼的 emoji”,KOSMOS-2 可以成功定位到图片之中的心形(1),当输入有多少头牛在图片中,KOSMOS-2 不仅可以回答“Two”,还可以真正的定位到是哪两头牛(2),又如输入一张图片我们询问横幅上是什么字,KOSMOS-2 也能准确识别,并且给出定位(3)。原创 2023-06-29 09:42:50 · 253 阅读 · 0 评论 -
ChatGPT想要输⼊的⽂本太⻓解决方案
当我们⼿⼯分解任务的时候,需要把之前的任务的历史信息,发给后续的任务⾥做为输⼊。如果能把对过去记忆的召回,也做为⼀种可选择的⼯具。然后你按照 ChatGPT 的指令,去 Google 搜索,再把结果作为下⼀次的聊天内容喂回去。5. 让 ChatGPT 分解任务:你帮助它分解任务毕竟是基于规则的算法,对问题的适应性有限。如果你英语不错,还懂⼀点点编程技术,可以参考微软提供的提⽰词技巧军⽕库,⾥⾯有⼤量的使⽤⼲货。在短暂的激动过后,你发现仅有 4000 个 token 的上下⽂似乎不⾜以完成你想做的⼯作。原创 2023-06-29 08:29:56 · 75 阅读 · 0 评论 -
为什么OpenAI内部对AI Agents最感兴趣
我认为AI Agents在某种程度上跟我是很近的关系,让我以一个故事开始,这是一个非常早期的OpenAI的故事,那时OpenAI可能只有十几个人,在2016年左右,当时的潮流实际上是RL Agents(强化学习代理人)。如果一篇论文提出了某种不同的训练方法,那么我们OpenAI内部的Slack群组里的讨论会类似于,哦是的,有人在两年半尝试过,它不起作用,我们对这种方法的来龙去脉非常了解。他还透露,如果一篇论文提出了某种不同的训练方法,OpenAI内部的Slack上会嗤之以鼻,认为都是他们玩剩下的。原创 2023-06-28 10:31:02 · 141 阅读 · 0 评论