AI行业资讯
文章平均质量分 91
技术狂潮AI
大模型技术应用入门|实战指南!我们专注于人工智能、LLM、RAG等前沿技术,探索大模型业务场景落地,分享技术干货、研究报告和IT技术资料。
展开
-
InternVL 1.5:开源多模态大模型的“黑马”,性能比肩GPT-4V! (开源免费|可商用)
InternVL 1.5 是一款开源的多模态大型语言模型,它在处理高分辨率图像和支持多语言方面取得了显著进展。该模型通过强大的视觉编码器和动态分辨率适配技术,以及整合全面的双语数据集,缩小了与商业模型之间的性能差距。在 OCR 相关任务和双语场景理解中,InternVL 1.5 展现了其增强后的能力,成为了先进人工智能系统中的有力竞争者。原创 2024-05-18 22:31:06 · 4590 阅读 · 0 评论 -
OpenAI 推出 GPT-4o:实现多模态 AI 交互
OpenAI 的 GPT-4o 是 AI 技术变革性的进步,它将文本、音频和视觉整合成一个协调且反应灵敏的模型。这一进展预示着 AI 交互将变得更加自然、吸引人且易于接触,为多模态 AI 系统设定了新的标杆。随着 GPT-4o 向用户和开发者的推广,它对 AI 应用和用户体验的影响将是深远和广泛的。原创 2024-05-14 16:45:46 · 2064 阅读 · 2 评论 -
Databricks 开源 DBRX:一款功能强大的新型企业级语言模型
从今天开始,Databricks 客户可以通过 API 使用 DBRX,并使用 Databricks 提供的工具和技术,从头开始预训练自己的 DBRX 级模型,或者在我们提供的检查点之上继续训练模型。Databricks 使用高达 32K 词元上下文窗口训练 DBRX,并完全在其平台上构建 DBRX,使用了 Unity Catalog 进行数据治理、Apache Spark™ 和 Lilac AI 进行数据处理和清理,以及 Mosaic AI 训练服务进行大规模模型训练和微调等工具。原创 2024-03-29 17:58:48 · 1608 阅读 · 0 评论 -
Jamba:AI21 实验室发布首个应用级的 Mamba 架构 AI 模型
AI21 实验室发布了,这是全球首个基于架构的、可用于实际应用的 AI 模型。目前大多数模型(例如 GPT、Gemini 和 Llama)都基于架构。Jamba 结合了 Mamba 结构化状态空间模型 (SSM) 和传统 Transformer 架构的优点,实现了性能和效率的显著提升。Jamba 拥有 256K 个 Token 的超长文本处理能力,相当于大约 210 页文本,同时可在单个 80GB 的 GPU 上容纳 140K 个 token。这一突破得益于其。原创 2024-03-29 17:54:36 · 1405 阅读 · 0 评论 -
RAFT:让大型语言模型更擅长特定领域的 RAG 任务
生成式 AI 对企业最具影响力的应用之一是创建能够访问已有知识库的自然语言接口,换句话说,它能够针对银行、法律和医学等特定领域提供问题解答。原创 2024-03-25 19:25:39 · 2275 阅读 · 0 评论 -
Grok-1 开源:马斯克旗下xAI公司发布革命性AI模型,开启开源大模型新篇章|3140亿参数
xAI 的 Grok-1 体现了技术复杂性、伦理考量和前瞻性创新的结合。它的发布不仅为AI技术的进步做出了贡献,还为AI模型的开发和集成到数字互动和信息交流的结构中设定了新的标准。随着Grok-1的不断进化和适应,它有望成为寻求知识和技术进步的宝贵资产。Grok AI 助手将包含在 𝕏 Premium+ 中。要下载 Grok-1 的模型权重,请使用下面的磁力链接。您需要一个Torrent下载客户端。magnet:?原创 2024-03-18 10:51:03 · 2051 阅读 · 0 评论 -
一图窥探RAG技术发展现状
2023年除了大语言模型,听到最多的当属RAG(检索增强生成技术了),在实际业务场景落地过程中,由于大模型目前的一定局限和能力现状以及Token限制、训练成本等多种因素的影响下,RAG不得不成为大家选择快速试错、落地的一种选择和方案。RAG技术通过查询处理、数据检索、文档优化、增强生成、语义理解、文档结构化和自我增强等多步骤,实现了对用户问题的深度理解和高效回答。🔍📈 从自然语言到数据库查询,再到精准答案,RAG技术让AI的每一步都更加智能和人性化,让我们从这一张图来了解RAG技术体系的全貌。#RAG原创 2024-02-07 10:18:43 · 1590 阅读 · 0 评论 -
AI革命新篇章:法国天才团队挑战ChatGPT霸主地位
随着 Mistral 的创新不断涌现,我们看到了 AI 领域的新篇章正在被书写。这些小巧而高效的模型,不仅在性能上挑战了行业巨头,更是在可访问性和实用性上迈出了重要一步。Mistral 的 Medium 版本和 Mixtral 8x7b 的推出,不仅展示了 AI 的新高度,也为开发者和企业提供了前所未有的机遇。在这个快速变化的时代,Mistral 的故事提醒我们,创新的力量是无穷的,而 AI 的未来,正等待着我们去探索和定义。原创 2024-02-02 17:38:03 · 1211 阅读 · 0 评论 -
Lepton Search :不到 500 行代码构建对话式搜索引擎|开源|可商用
最近前阿里巴巴副总裁贾扬清在 Twitter 上公布了的开源项目链接,Apache License 授权,任何人、任何公司都可以自由使用开源代码。大家可以阅读一下源码,非常简洁,核心部分用了 500 行 Python 就实现了一个类似 Perplexity 的生成式搜索引擎。原创 2024-01-30 15:49:53 · 1936 阅读 · 0 评论 -
深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
Mixtral 8X7B是Mistral AI公司在大语言模型领域的一次重大突破。它采用了一种名为"专家混合"(MoE)的架构,这种架构由8个专家组成,每个专家组有7个亿参数。这种高效的架构使得Mixtral能够在多个领域表现出色,具有出色的处理能力。Mistra l对持续优化的坚定承诺,将确保Mixture 8X7在AI领域保持领导地位。随着 Mistral 不断优化和调整Mixture ,我们有理由相信,它将带来更多的突破,从而在人工智能和广泛行业中产生意义深远的影响。原创 2024-01-12 11:22:17 · 2452 阅读 · 0 评论 -
[译] 2023: AI 的一年
2023年的AI发展重点在于现有技术的改进,未有像ChatGPT或图像生成器那样的革命性突破。这一年被视为过渡期,为向更强大的AI未来迈进做准备。2.Adobe Firefly和Generative Fill推动了视觉内容创作的多样化。Midjourney V.5和V.6模型提高了图像生成的效率和连贯性。DALL·E 3简化了图像生成过程,提高了用户体验。Shutterstock.AI的加入和对艺术家的认可标志着伦理AI的重要一步。3.原创 2023-12-26 17:19:23 · 951 阅读 · 0 评论 -
Mistral AI发布行业领先的Mixtral 8x7B专家混合模型&完成4.15亿美元融资
Mistral AI在AI领域取得了双重突破,完成了4.15亿美元的融资,并发布了革命性的Mixtral 8x7B专家混合模型。这一模型不仅推动了技术的创新边界,还为开发者社区提供了前所未有的资源。Mixtral 8x7B以其卓越的性能和成本效益比,在AI基准测试中超越了现有模型,同时保持了对开发者友好的Apache 2.0许可证,确保了其广泛的可接入性和应用潜力。Mistral AI的这一成就标志着它在推动AI技术民主化方面迈出了坚实的一步。原创 2023-12-13 00:08:20 · 1356 阅读 · 0 评论 -
Google 发布最强大模型Gemini,能力与GPT-4相当
Gemini 是一个多模式模型系列,在图像、音频、视频和文本领域展示了真正强大的功能。其中功能最强大的模型在 32 个基准测试中的 30 个中提升了最先进水平,其中包括 12 个流行文本和推理基准测试中的 10 个、9 个图像理解基准测试中的 9 个、6 个视频理解基准测试中的 6 个以及 5 个语音基准测试中的 5 个识别和语音翻译基准。Gemini Ultra 是第一个在 57 个科目的 MMLU 上达到人类专家表现且得分高于 90% 的模型。原创 2023-12-07 15:32:41 · 1114 阅读 · 0 评论 -
OpenAI暂停新的ChatGPT Plus注册 | OpenAI 的 GPT Builder 创建您的 GPTs
OpenAI DevDay 才过去仅仅一周时间,伴随着开发者大会上发布的一系列重磅升级和新特性,无疑这样的进化速度让广大网友炸锅了,其火热程度可见一斑。,排名前 50 名的 AI 工具在 10 个月中累计被访问 240 亿次,。似乎出现这样的结果大家并不感觉到意外,从发布会结束后,紧接着11月8日,ChatGPT和API发生了一场全球大宕机,故障时间断断续续超过了两个小时。足以看出很多人都已经迫不及待的想尝试 OpenAI 发布的一系列全新的AI能力,所以注册的用户数暴增也是可以想见的。原创 2023-11-15 17:04:50 · 1233 阅读 · 1 评论 -
GPT-4 Turbo:OpenAI发布旗舰版GPT-4模型,更便宜|更强大|128K上下文|支持多模态
OpenAI 在 2023 年 11 月 7 日举行首届开发者大会,此次展会的亮点无疑是 GPT-4 Turbo 的亮相,它是 OpenAI 著名的 GPT-4 模型的升级版。GPT-4 Turbo 有两种变体:一种用于文本分析,另一种能够理解文本和图像。GPT-4 Turbo 的上下文窗口扩展为 128,000 个标记或大约 100,000 个单词,比其前身 GPT-4 大四倍。该模型还提供对截至 2023 年 4 月的知识截止日期的最新信息的访问。原创 2023-11-07 20:16:51 · 2581 阅读 · 0 评论 -
埃隆·马斯克的 AI 聊天机器人 Grok 已经上线
Grok 是根据科幻经典《银河系漫游指南》中的好奇人工智能进行建模的。它旨在成为一个机智、幽默、知识渊博的 AI 助手,可以就广泛的话题进行自然对话。在 Twitter 上分享的演示中,Grok 显示出它可以理解幽默并以自己的笑话和有趣的俏皮话回应。这种能够开玩笑的能力使得与其他更机械化的聊天机器人相比,与 Grok 聊天更加有趣和吸引人。Grok 的支柱是 Grok-1,xAI 的最新大型语言模型。Grok-1 拥有 632 亿个参数,比 GPT-3.5 多了一倍。原创 2023-11-07 13:02:36 · 531 阅读 · 0 评论 -
AI情绪检测器:准确检测并解读人类情绪
情绪分析在数字世界中被广泛应用,用于评估消费者对产品或品牌的情绪。然而,在线下环境中,用户与品牌和产品进行互动的场所(如零售店、展示厅)仍然面临着自动测量用户反应的挑战。使用人工智能进行面部表情情绪检测可以成为衡量消费者对内容和品牌参与度的可行替代方案。ParallelDots结合了心理学、人类表情和人工智能,开发出一种能够自动识别个人脸上不同情绪的面部情绪检测算法。该算法能够实时识别七种不同类型的情绪状态。原创 2023-10-11 10:57:07 · 5144 阅读 · 2 评论 -
OpenAI发布ChatGPT企业级版本
简而言之,ChatGPT Enterprise是 OpenAI 服务的转变,汇集了最好的人工智能功能,并确保符合企业的特定要求。它不仅仅是一个升级,而是为企业提供先进且符合安全需求的工具。对于那些担心业务数据安全的企业来说,ChatGPT Enterprise将成为他们寻找的解决方案。它结合了先进的人工智能功能和出色的安全性能。随着企业在数字领域的不断发展,像ChatGPT Enterprise这样的工具无疑将成为引领潮流的火炬,带来安全性、创新和效率方面的突破。原创 2023-08-30 12:20:21 · 1522 阅读 · 0 评论 -
Meta AI 重磅发布代码大模型 Code Llama
刚刚,Meta AI 如期而至发布了 Code Llama ,这是一个可以使用文本提示生成代码的大型语言模型 (LLM)。Code Llama 是针对代码任务的公开LLM的最先进技术,有可能使当前开发人员的工作流程更快、更高效,并降低学习编码人员的进入门槛。Code Llama有潜力用作生产力和教育工具,帮助程序员编写更强大、文档更齐全的软件。值得让人兴奋的是,Code Llama 完全开源,现已公开供研究和商业用途。原创 2023-08-24 23:45:44 · 599 阅读 · 0 评论 -
Meta AI发布SeamlessM4T模型,支持转录和翻译近100种语言|已开源
Meta AI 近期的重磅动作频频不断,短短一个多月的时间接连发布了一系列开源大模型,下面我们看看都有哪些有影响力的产品。总之,SeamlessM4T是一款非常强大、先进的AI翻译模型,它可以帮助用户更好地进行跨语言交流。如果你需要进行跨语言沟通,那么SeamlessM4T绝对是一个值得尝试的工具。原创 2023-08-24 14:14:25 · 604 阅读 · 1 评论 -
[Google] DeepMind Gemini: 新一代LLM结合AlphaGo技术将力压 GPT-4|未来 AI 领域的新巨头
年,人工智能实验室孕育出的人工智能程序在围棋赛场上一举击败冠军选手,成为历史的见证者。如今,DeepMind 联合创始人兼首席执行官 Demis Hassabis 表示,他们的工程师正借鉴 AlphaGo 的技术研发一款名为的人工智能系统,其实力将超越 OpenAI 的 ChatGPT 背后的系统。原创 2023-08-17 14:01:20 · 954 阅读 · 0 评论