自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1663)
  • 收藏
  • 关注

原创 20240921 每日AI必读资讯

仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。- Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解码器和多流音频语言模型,实现了对话中的重叠、打断和插入语处理。- Moshi是全双工语音对话系统,将对话视为语音到语音的生成过程,解决了传统语音对话系统的问题。- 英特尔声称Gaudi3的能效是前代产品的两倍,将挑战NVIDIA的统治地位。- 9月19日,一年一度的阿里云栖大会拉开帷幕。

2024-09-20 19:09:23 982

原创 20240920 每日AI必读资讯

Dream Machine API 提供直观的系统来创建和编辑视频,用户无需在应用中构建复杂的工具,也不需要切换到其他视频编辑器。- 随着技术的发展,伦理和责任使用的问题逐渐突显,EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。- 选择图像后,然后Veo模型将基于所选图像生成6秒长的高质量背景视频,以实现用户的创意愿景。- 该模型通过创新的架构和技术,生成的音频样本在质量上优于现有开源模型,具备广泛的应用潜力。无需掌握复杂的提示工程,用户可以通过简单的文本指令生成视频。

2024-09-19 18:35:06 1535

转载 新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了

阿里开源,又拿第一了。这次是在就在刚刚,阿里国际AI团队开源多模态大模型。在多模态权威综合评测基准OpenCompass上,Ovis1.6-Gemma2-9B版本综合得分超越Qwen2VL-7B、InternVL2-26B和MiniCPM-V-2.6等主流开源模型,在300亿以下参数开源模型中位居第一。在数学推理和视觉理解等多项任务中,得分甚至超过了闭源的GPT-4o-mini。具体来说,Ovis1.6能胜任视觉感知推理、数学和科学、生活场景等多种多模态任务。

2024-09-19 18:34:10 120

原创 20240918 每日AI必读资讯

Snap 基于 OpenAI 打造了自己的聊天机器人 My AI,用户可以通过手势和语音控制设备,体验多种增强现实应用,还可以利用 AI 根据语音提示生成 3D 动画等。- 可以通过输入多模态数据(如文本描述、音频参考、乐谱、声音提示等)来生成音乐,并且提供了方便的后期编辑功能,比如修改歌词或旋律。- Luma AI推出Dream Machine模型API,开放给所有用户,按生成像素数量收费,提供高级特性。- 还支持音乐转换,只需10秒的语音或歌声录音,即可将其转换为不同风格的音乐。

2024-09-18 18:10:06 1920

转载 AI大佬齐聚国际顶会KDD 2024,中国队刷脸!大模型教育应用分析论文被录用

席间,圣母大学教授、AAAS/AAAI/ACM/IEEE Fellow Nitesh Chawla,明尼苏达大学教授、IEEE Fellow George Karypis、松鼠Ai联合创始人梁静博士,美国东北大学教授、ACM/IEEE Fellow Ricardo Baeza-Yates四人,一起在台上探讨了生成式AI的未来方向,以及潜在的创新应用。时间序列分析在教育场景中的应用日益广泛,例如,通过分析学生的行为数据、测试成绩和学习习惯,可以预测学生的学习进度,优化教学策略。

2024-09-18 17:37:17 389

原创 20240918 每日AI必读资讯

研究人员设计了一个完整的实验,可以评估模型在新研究思路生成方面的能力,同时对可能的干扰因素进行控制,首次将专家级的自然语言处理(NLP)研究人员与LLM创意代智能体进行直接比较。- 实验招募了超过100名高水平NLP研究人员来撰写新想法,然后对LLM生成的想法和人类想法进行盲审,参与者来自 36 个不同的机构,大部分是博士和博士后。- 斯坦福大学的研究人员最近发布了耗时一年完成的新实验,获得了第一个具有统计学意义的结论:LLM生成的想法比人类专家撰写的想法更新颖!- 一句提示,即刻把想法变成PPT。

2024-09-18 03:01:58 1658

转载 o1突发内幕曝光?谷歌8月论文已揭示原理,大模型光有软件不存在护城河

发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式。这项研究表明,增加测试时(test-time)计算比扩展模型参数更有效。基于论文提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个的模型。网友表示:这几乎就是o1的原理啊。众所周知,奥特曼喜欢领先于谷歌,所以这才是o1抢先发preview版的原因?

2024-09-18 01:51:54 287

转载 战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

在提示词的编写思路上,LLM更倾向于安全的主题,与人类的偏好不一致,所以研究人员为了统一目标,从最近的NLP会议的征稿页面中提取了七个具体的研究主题,包括偏见(bias)、编码(coding)、安全性(safety)、多语言性(multilingual)、事实性(factuality)、数学(math)和不确定性(uncertainty)。在实验过程中,研究人员意识到,即使是专家,对想法新颖性的判断可能也非常困难,因此,文中提出了一个端到端的研究设计,招募研究人员将这些想法转化为完整的项目。

2024-09-18 01:51:11 132

转载 微软Office全家桶再爆办公革命,o1模型加持重塑十亿人工作流!1句话生成PPT+自定义智能体

为了提升使用体验,连代码编辑器都是经过设计的,不仅有语法高亮、代码补全,公式栏中还能实现多段代码统一管理,和开发者们最喜欢的Visual Studio Code有很多类似的体验。如下面视频所示,Copilot Studio的创建操作相当简便,只需要用文字描述所需功能,再传入包含相关基础信息的文档,你就得到了一个立即可用的智能体。比如,直接输入数据可视化的要求,Copilot就能自动帮你生成绘制折线图的Python代码,还能立即看到绘制结果,「所见即所得」。

2024-09-18 01:48:23 269

原创 20240917 每日AI必读资讯

7. CVPR 2025 的 PCs 计划将 CVPR 2025 的审稿数据私下分享给未来相关会议的 PCs。这些数据将精准地「归责到人」,包括对审稿质量的评估以及迟交的统计数据。- o1-preview模型在网络安全测试中展现出意外的能力,能够绕过挑战直接获取目标信息。5. 在最终论文决策公布后,审稿人的名字将在 OpenReview 上对其他审稿人可见。- o1模型能够协助专家复制生物威胁,但对非专家的影响有限,风险相对较低。3. 每位作者最多提交 25 篇论文,超过数量限制的论文将被直接拒绝。

2024-09-16 23:27:29 1534

转载 ChatGPT 抛弃了 Next.js,全面拥抱 Remix!

近期,ChatGPT 官网将前端框架从 Next.js 更换为Remix,这一举动引发了业界的广泛关注与讨论。Next.js作为当前全球下载量第二的前端框架,仅次于 React,其影响力和普及程度可见一斑。而 Remix 作为一个相对较新的 React 框架,自开源以来一直保持着低调的发展态势。ChatGPT的这一框架切换决策无疑激起了众多开发者的好奇心。本文旨在探讨 ChatGPT 可能出于何种考虑而做出这一转变。

2024-09-16 23:11:24 448

转载 刚刚,CVPR 2025新规来了:审稿进入「半实名制」,不负责任的审稿人将被标记并拒稿

其次,考虑到一篇论文通常涉及多位作者,该规定意味着一旦其中一位作者在审稿过程中表现不佳,整篇论文就可能面临被拒稿的风险,其他合著者也不得不为这位作者的失误承担责任。AAAI 2025 发布的公告也对单个投稿人的投稿数量进行了限制,每位作者最多只能向 AAAI-25 技术赛道提交不超过 10 篇论文,且提交后不得在论文上增加作者。到了 2024 年,投稿数量首次突破了一万大关。虽然这套强制审稿,并且要求审稿人保质保量完成审稿意见的「组合拳」拳拳到肉,也对「大水漫灌」树立了护栏,但是评论区更多的是质疑的声音。

2024-09-16 23:07:00 141

原创 20240916 每日AI必读资讯

• 公式、表格、图表识别:除了基本文本识别,GOT 还能识别和处理文档中的数学公式、化学分子式、表格、图表等复杂结构,并将其转换为可编辑的格式(如LaTex 或 Python 字典格式)。• 格式化输出:OCR-2.0支持生成多种格式化输出,包括Markdown、TikZ、SMILES、LATEX等,能够将识别到的字符以结构化的方式输出,例如表格、数学公式、分子结构等。- 可以处理各种复杂的OCR任务,不仅包括普通文本,还可以识别公式、表格、乐谱等复杂内容。- 还可以与实际照片背景无缝结合,增强沉浸感。

2024-09-16 22:15:43 682

转载 超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手

陶哲轩表示,虽然这篇MathOverflow上的帖子可能已经包含在o1的训练数据中了,但依旧能展现模型在语义搜索方面的强大功能,而且搜集、总结出的答案的质量可以与MathOverflow这类专业的问答网站相当。对此,Jim Fan的想法是,作为评论者(critic)的奖励模型,提升速度小于作为行动者(actor)的生成模型,因此尽管二者都在提升,最多3轮迭代后,后者就会追上前者,达到饱和。简而言之,竞赛问题的核心逻辑、算法,以及bug的诊断调试,都必须由人类选手独立完成,CF也会进行作弊检测。

2024-09-16 22:07:40 219

转载 o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光

自从的名字出现在OpenAI o1背后团队名单中,他在o1中发挥了哪些作用,一时间成为不少网友的关注焦点。这不,机器学习工程师Rohan Paul刚刚发帖表示,去年5月份Ilya合著的一篇论文不能错过。论文题为“不光是Ilya,其中还有不少作者同样是OpenAI o1的背后贡献者。甚至有网友将这篇论文称作是AI领域仅次于“Attention is all you need”的第二著名论文。

2024-09-16 21:20:55 100

原创 20240915 每日AI必读资讯

通过使用大量游戏视频数据进行训练,GameGen-O 让游戏开发者可以更快速地创建复杂的游戏世界,减少手工设计的工作量,提升开发效率。- 用户只需上传视频,给出特定的提示(例如某种风格、动作或表现方式),系统就会根据这些提示生成新的视频内容。- 该功能为视频生成提供了更精确的控制,使生成的视频在动作、表现力和意图上更加精准。- 要求所有的AI生成内容都要打标,包括文字、图像、视频、音频…• 文本到视频生成:用户可以通过文本提示生成5-20 秒的视频。• 灵活的宽高比:允许用户生成任意宽高比的视频。

2024-09-14 18:47:55 1236 3

原创 20240914 每日AI必读资讯

应用前景广阔: 教育领域支持语言学习,娱乐产业即时语音克隆,辅助技术视障人士工具,智能客服和跨文化交流。- 多语言支持大幅提升: 训练数据量翻倍至70万小时,支持8种主要语言,拓展了应用范围。- 性能与功能全面升级: 超快速度与低延迟,即时语音克隆功能,灵活部署选项和API服务。转换上传的音频:试试上传一段你唱歌、哼唱或演奏乐器的片段,使用翻唱功能进行重新演绎。- DataGemma模型旨在减少AI在统计查询中的错误,提高准确性。- OpenAI o1模型需要简单、直接的提示,而非复杂的指导。

2024-09-13 19:02:53 1927

转载 刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

在 2024 年 AIME 考试中,GPT-4o 平均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。不过,用户的使用量有限。

2024-09-13 18:30:39 435

原创 20240913 每日AI必读资讯

无需复杂的规则或正则表达式,模型能自动处理噪声内容,如广告、脚本、导航栏等,生成结构清晰的 Markdown。- 一旦上传了文档并点击生成按钮,两位 AI 主持人将启动一个类似对话的讨论,深入剖析文档中的主要内容。- 会总结内容,探讨文档中的主题,并尝试建立不同概念之间的联系,为用户提供一个对话式的学习体验。- 可以快速流畅地回应,识别并生成各种语调,并满足个性化的需求,例如调整语速或模仿说唱风格。- 生成的内容并不是对文档的全面分析,而是基于用户提供的资料进行总结。- 可以将任意文档转换成播客对话。

2024-09-12 19:28:43 2319

转载 AMD死战CUDA:我是一家软件公司

早在2019年,AMD大刀一挥,历史悠久的GCN GPU架构宣告终结,从此分为两条路线:RDNA架构面向图形与视频,也就是我们熟知的Radeon游戏显卡,而CDNA架构则面向AI、HPC,也就是Instinct计算卡,迄今都已经发展了三代。,从经典的CPU和GPU,到XDNA FPGA芯片(通过收购赛灵思获得)。对于昨天的芯片的巨头而言,角逐的焦点更多是光栅化、光线追踪和带宽的竞争,然而接下来,生成式AI的爆火已经打乱了原来的布局,下一代的挑战不止在于硬件,还在于软件支持,在于软件开发者生态是否足够紧密。

2024-09-12 19:24:57 659

原创 20240912 每日AI必读资讯

独立产品:尽管草莓是ChatGPT的一部分,但它将作为一个独立的产品发布,具体如何提供尚不清楚。- 多模态能力的缺失:草莓的初始版本仅支持文本输入和输出,不支持图像处理。- 定价和使用限制:草莓的定价预计将不同于目前ChatGPT的免费和订阅模式。- 推理功能:草莓最显著的特点是它在回答问题前会“思考”10至20秒,这与现有的对话式AI立即回答的方式不同。他们将 ChatGPT 用作探讨想法的伙伴、故事顾问、研究助手和编辑,以讨论想法、寻找合适的词语、理清思路,并就结构和流畅性获得反馈。

2024-09-11 18:57:55 2170 1

转载 OpenAI神秘模型「草莓」两周内上线?数学推理暴涨,月收费200刀已有人付费

很多LLM的弱点就在推理能力上,而有些初创公司为了提高它们的推理能力,就采用了一种廉价的技巧,将问题分解为更小的步骤,尽管这些方法速度慢且成本高昂。另外,在FLOPs一致的评估中,对于那些较小的基础模型已取得一定程度非平凡成功率的问题,测试时计算可以使其超越规模大14倍的模型。草莓可能会有低价位和高价位的两档,前者会有速率限制,并且限制用户每小时的最大消息数量;另外,在去年Q*的前期准备中,OpenAI研究人员开发了一种被称为「测试时计算」的概念变体,目的是提升LLM的问题解决能力。

2024-09-11 18:53:13 548

原创 20240911 每日AI必读资讯

支持多个平台开发,提供 SDK(软件开发工具包)供开发者使用,包括 React、JS、Unity、Swift、iOS、Android、Flutter、Rust、Next.js 等。这使得开发者可以快速构建和集成各种应用功能。- 该实验项目名为Project Sid,模拟了AI代理在Minecraft服务器中共同创建虚拟文明,包括经济体系、政府机构、文化实践,甚至宗教机构。- 应用具有上下文积累的能力,在语音按钮未按下时,它会累积上下文信息,让应用能够更好地理解用户的指令和意图,提升语音指令的准确性。

2024-09-11 01:21:23 2147

原创 20240910 每日AI必读资讯

Baszucki 描绘了一个设想的场景:例如在一个虚拟的 D&D 游戏中,游戏世界可以随着地牢主的描述而即时生成,玩家的每一个行动都能实时影响环境的变化。-Mini-Omni不仅在语音识别(ASR)和语音生成(TTS)任务中表现优异,在多模态任务(如TextQA、SpeechQA)上也具备强大的推理能力。- 推动AI民主化:Fluxgym的推出将促进AI爱好者参与模型训练,推动FLUX Lora模型的发展,为更广泛的用户群体打开AI世界的大门。- 不仅支持语音,还支持文本等多模态输入。

2024-09-09 18:53:19 2388 1

转载 Sora陷研究泥潭?OpenAI一年血亏50亿,高盛报告乌龙引AI股地震!

这表明,大规模投资的增长和有竞争力的模型,正在AI领域涌现,正如之前几波技术浪潮中所发生的那样。显而易见的是,AI视频模型中,诸如Runway Gen-3 Alpha、Dream Machine,以及国产爆火视频模型,不仅接近Sora实力,还可以免费用。当前AI领域的赢家「护城河」相当显著,估值也不像泡沫,但该领域的新专利数量正在迅速增长,这表明新的竞争者将会出现,成本将会下降。高盛补充道,正如竞争常常被低估一样,创新资本支出的回报通常被高估,因为随着时间的推移,技术的边际成本会下降,产能会增加。

2024-09-09 18:52:43 684

转载 这就翻车了?Reflection 70B遭质疑基模为Llama 3,作者:重新训练

在被质疑 Reflection 70B 的基础模型可能是 Llama 3 而非 Llama 3.1 70B 时,Matt Shumer 坐不住了,现身进行了澄清,并表示是。它的底层模型建立在 Meta Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,确保了与现有工具和 pipeline 的兼容性。此外,Reddit 上 LocalLLaMA 社区的一个帖子比较了 Reflection 70B 与Llama 3.1、Llama 3 权重的差异,结果显示,

2024-09-08 22:15:44 159

原创 20240908 每日AI必读资讯

从 2018 年起,Michael Smith利用脚本创作了数十万首音乐, 这些音乐不仅有不同的名称,Smith 还为它们虚构了不同的作者,上传到Amazon Music、Apple Music、Spotify、YouTube Music 等流媒体平台,以此欺骗平台。- MiniCPM 3.0 在自然语言理解、知识、代码、数学等多项能力上对GPT-3.5 实现赶超,并超越 Qwen2-7B,Phi-3.5,GLM4-9B,LLaMa3-8B 等一众中外知名模型。4分钟,构建了一个用于提交漏洞的网站。

2024-09-08 18:40:37 1542

原创 20240907 每日AI必读资讯

只需要用普通的语言描述你想要的应用,AI 就会自动处理复杂的步骤,比如设置开发环境、编写代码、甚至部署到网上。- 可以将文档图像(比如扫描的书页、PDF页面等)转换成可以编辑的文本格式,比如 Word 或 TXT 文件,同时保留图像中的版面布局。-RapidLayoutRecover 可以自动识别图像中的文本、表格、公式等内容,帮助用户将这些图像转换为可以进一步编辑和处理的格式。- 而且,可以随时查看和修改 AI 生成的代码,学习编程的过程。- 用户就不必手动输入或重建文档中的内容,大大节省了时间和精力。

2024-09-06 19:09:02 1418

原创 20240906 每日AI必读资讯

Yi-Coder-9B 的表现优于其他 10B 参数以下的模型,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够与 DeepSeek-Coder 33B 相媲美。- 9月3日,马斯克在推上自曝:团队仅仅用了122天时间,就建成了有10万张H100的Colossus集群,是世界上最强大的AI训练系统。- 模型不仅支持各种音频和视觉风格,还能够生成高度逼真的细节,包括面部的微表情、眉毛和眼睛的细微变化以及头部的自然运动。- 并且生成头部和面部的自然动作,如表情变化、头部移动等。

2024-09-05 18:44:28 2186

转载 全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

Colossus所在地,田纳西州孟菲斯的环保组织前几天刚刚写信控诉马斯克,指责他在没有许可的情况下安装了至少18台涡轮机(可能更多),加剧了当地的空气污染。如今,一些最大的GPU集群拥有超过3万个芯片,上面提到的这些超算更是达到了前所未有的规模。总的来说,仍在开发或计划阶段的设施建设成本可能超过500亿美元,其中包括约350亿美元的英伟达芯片,以及运营所需的额外数十亿美元。比如,马斯克就曾考虑和甲骨文达成一项大规模协议,根据他的计划,xAI将在未来几年内,花费超过100亿美元租赁英伟达的GPU。

2024-09-05 18:39:22 284

转载 微软Win11中发现国产开源大模型!RWKV官方:没人给我钱啊?现在捐赠还来得及

微软正尝试在Office中集成!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的,包含GPU、CPU版本。对这些二进制文件进行反编译检查,结果发现就是GitHub的RWKV.cpp项目的一种变体。人人都可以将Windows 11更新到最新版本,通过以下路径自行验证:或者,也可以在IT商店的任何“copilot Windows 11”设备上搜索系统文件中的rwkv。

2024-09-05 18:37:27 339

原创 20240905 每日AI必读资讯

该项目已经注册到ComfyUI-Manager,用户可以通过该管理器自动安装、更新和管理项目,简化了使用过程中的技术操作。- 小海哥完成了好几个项目,包括两个平台游戏、一个绘图应用、一个动画应用和一个 AI 聊天应用,每个项目大约花费 2 小时。- 马斯克计划将Colossus的GPU数量翻倍至200,000块,包括50,000块新版本的H200GPU。- 可以将编辑过的面部表情插入到现有的视频中,使视频中的人物表现出新的表情变化。- 文小言App功能得到显著增强,提供更丰富的使用场景。

2024-09-04 18:17:09 3014 1

原创 20240904 每日AI必读资讯

据悉abab-video-1目前已参考“视频生成模型的评测框架”V-Bench进行了评测,得分排名第一,比可灵和runway都高。- 幕后技术团队纷纷出自UC Berkeley、CMU、NTU、清华、北大、浙大、华为、腾讯、大疆、小米等国内外顶尖高校、企业。- abab-video-1具有压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频等特点,媲美电影质感。- 支持多种视频风格,无论是3D电影大片场景、2D动画,还是中式风格、科幻风格或美漫风格,均能轻松驾驭。

2024-09-03 23:13:22 2222

转载 中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

同样,绿洲资本投资负责人也表示,千寻智能的队伍既结合了产业理解,还积累了前沿技术。达晨财智投资团队则肯定了千寻智能在行业内的稀缺性——这样一个团队,是同时具备机器人硬件、具身AI算法能力以及商业化经验的老炮团队,紧密结合了过往的机器人工程化理解和前沿学术积累。这次千寻智能Spirit AI的天使轮融资,由弘晖基金领投,达晨财智、千乘资本跟投,同时,顺为资本和绿洲资本作为种子轮老股东也在持续加码。看到这儿之后,我们瞬感惊艳,可以畅想出千寻机器人走进家庭的未来,凭借强大的泛化能力,帮助人们完成各种各样的任务。

2024-09-03 23:05:04 453

原创 20240903 每日AI必读资讯

AutoGen Studio 是微软研究院开发的一款低代码工具,旨在帮助开发者快速原型设计、调试和评估由多个人工智能代理(Multi-Agent Systems)组成的复杂系统,类似dify、coze…- AutoGen Studio 通过提供用户友好的拖放界面,让开发者能够快速构建和原型设计多代理系统,即使开发者的编程经验有限。- 通过直观的拖放界面和Python API,使开发者能够轻松配置和组合生成式AI模型与工具,从而解决一些复杂的长时任务。该模型可以生成融合了现实与插画元素的图像。

2024-09-02 19:59:42 1484

原创 20240902 每日AI必读资讯

生成标准证件照:HivisionIDPhoto支持根据不同的规格要求生成标准证件照, 适用于各种用途,如护照、签证等 用户可以指定尺寸,并根据需要调整背景颜色和其他参数。- CEO兼创始人Bernt Børnich表示,希望NEO能完成人类不喜欢做的任务,比如清洁、整理等日常杂物,并能听从指挥,根据用户的偏好和生活方式进行定制。- 用户可以通过提供的Web页面实时生成和调整证件照,可以方便地在线操作证件照生成过程,实时查看和调整生成效果。- 专为人类设计,专为家庭环境而打造的人形机器人。

2024-09-02 01:37:49 1690

转载 韩国N号房卷土重来?AI造假?!

用 AI 检测 AI 的方法是可行的,但这类的检测工具依然存在问题,这方便了深度伪造技术的进一步对抗训练,从而导致 DeepFake 技术再度进化。很多未成年人把手伸向身边的同学,即使是一张普普通通的生活照,在 AI 软件的帮助下也能轻松制作出她们的“淫秽视频”。所谓的极具亲密性的图像、视频,用 AI 制作的“淫秽视频”都不是首要问题,真正危险的地方在于假冒他人身份。而更加绝望的是,根据韩国警方的统计,抓捕的 120 名虚假视频犯罪嫌疑人中,青少年几乎占75.8%。

2024-09-02 00:35:36 117

转载 OpenAI家庭机器人NEO登场,动作丝滑逼近人类!穿着西装的「人」却专做家务

官方博客表示,「我们的首要任务是安全」。经过不同场景和环境的测试后,NEO将在挪威的工厂中进行大规模生产。而在目前Beta测试阶段,1X将在将在选定的家庭中部署有限数量的NEO,用于研究和开发中至关重要的——数据。受到数字助理和自动驾驶的启发,1X的数据收集不同于传统的编码和预定义算法。他们使用了一种名为VR Teleop的方法。操作员会引导机器人在不同的现实场景中工作,让机器人直观地了解任务的难度和可行性。当收集数据达到一定规模时,机器人就学会了一项新技能。

2024-09-02 00:25:06 492

原创 20240901 每日AI必读资讯

不仅能识别、跟踪、分割视频中的对象,还可以统计每个对象的数据,并转化为图表,比如折线图、柱状图和饼图,方便你理解和分析数据。-简单易用:只需要把项目中的文件加入到你的网站里,就可以轻松实现放大镜效果,而且你还可以根据需要进行一些简单的定制。- 放大效果平滑:当你把鼠标移动到图片上时,放大镜会跟着你的鼠标移动,展示图片的放大部分,效果非常流畅。饼图:用来显示各类别在整体中的占比,比如视频中检测到的物体中,车占多少,人占多少。柱状图:用来比较不同类别的物体数量,比如在视频中有多少辆车、多少个人。

2024-09-01 15:44:49 808

转载 执教10年46枚美国IMO金牌!对话前总教练罗博深:不看好AI教育,不建议AI辅助学数学

在中国奥数队历史性五连冠被美国队终结后,一个名字被反复谈起。。他是前美国奥数功勋教练,执教十年间,队员们累计获得 46 枚 IMO金牌。此前他被媒体评价为带领美国奥数队伍重回巅峰,迎现在「黄金时期」。尽管去年已从领队职位卸任,今年美国队的夺金,他同样功不可没。应美国数学协会MAA之邀,罗博深在今夏最后一次主持主办了MOP夏训,并和其他负责人一起,选出了代表美国队参加IMO的六名队员。

2024-09-01 15:39:58 302

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除