自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(298)
  • 收藏
  • 关注

原创 大模型也会“说谎“?深度解析幻觉成因与治理方案

大语言模型的“幻觉”问题已成为AI可信度的关键挑战。研究表明,幻觉源于训练机制缺陷、评估体系偏差和优化策略不当,导致模型在不确定时倾向于“自信犯错”。这种现象在医疗、法律等领域已造成实际危害。解决方案包括重构评估体系、校准置信度、加强人机协同和优化数据质量。研究指出,需将幻觉视为系统性问题,通过全链路治理构建可信AI。实践表明,专业评估策略和数据优化可有效提升模型可靠性,推动AI向“可信可靠”方向发展。

2025-12-24 15:46:17 882

原创 澳鹏亮相EMNLP2025:以多元语言数据赋能下一代NLP技术

EMNLP2025会议聚焦多语言NLP技术前沿,语言多样性研究成为核心议题。澳鹏Appen分享了《多语言LLM翻译》研究成果,揭示20多种语言的翻译质量差距。会议重点关注代码切换数据集构建、语言识别技术等方向。澳鹏提出方言导向招募、文化适配标注等实践方案,强调建立能捕捉语言特征的数据管道。会议表明方言和语言变体正引领下一代语言模型发展,产学研合作将推动多语言NLP技术新突破。

2025-12-10 15:22:32 463

原创 案例 | 解锁机器人感知能力:澳鹏具身智能数据采集如何破局场景化落地

机器人技术正从结构化场景向开放环境拓展,具身智能成为突破交互瓶颈的关键。某全球机器人领军企业与澳鹏合作,通过高质量多模态数据提升机器人在复杂环境中的感知与决策能力。

2025-11-26 17:46:24 1555

原创 数据集月度精选 | 高质量具身智能数据集:打开机器人“感知-决策-动作”闭环的钥匙

具身智能正成为下一代AI发展核心,但面临高质量多模态数据不足的挑战。本期推荐两大核心数据集:1000小时机械臂遥操数据集(覆盖多场景任务,含多模态同步数据)和第一人称手部操作数据集(专业场景动作捕捉)。这些数据从通用智能形成、环境适应性及任务迁移三个维度,助力攻克跨模态融合、动态适应等瓶颈。澳鹏提供800+成品数据集,支持80+语言,持续为AI模型训练提供高质量数据解决方案。

2025-11-12 16:40:16 510

原创 澳鹏MatrixGo自定义模板:重塑数据标注的敏捷范式

数据标注行业正经历从标准化向场景化转型。澳鹏MatrixGo平台推出的自定义模板功能,通过四大创新突破行业瓶颈:1)可视化拖拽界面实现零代码工具搭建;2)智能规则配置简化复杂任务处理;3)全链路质检体系确保数据质量闭环;4)专业组件库覆盖文本、代码、多媒体等八大应用场景(包括质量评分、信息提取、视频理解等)。该升级使标注工具开发摆脱编码限制,让业务专家能快速创建专业标注界面,显著提升大模型训练数据的生产效率和质量。

2025-10-29 17:23:11 632

原创 案例 | 医疗数据全球化采集:澳鹏如何破解多模态生理数据壁垒?

医疗AI发展面临多肤色人群数据匮乏、合规门槛高等挑战。澳鹏数据通过专业采集方案,帮助客户快速获取高质量、合规的多模态医疗数据(血糖、血压、房颤等),覆盖不同人种和健康状态。

2025-10-15 18:07:18 717

原创 小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马

全球AI竞争正式进入“数据决胜”时代。Meta、xAI等巨头纷纷重押高质量数据,而中国数据服务领军者澳鹏凭技术壁垒与高端人才优势,在上半年实现营收3.06亿元,同比增长90%。本文深度解析澳鹏如何为450+客户构建从数据到智能的核心竞争力。

2025-09-23 19:17:03 931

原创 澳鹏数据集月度精选 | 覆盖全模态理解、复杂推理、海量真题的快速部署方案

在AI技术快速迭代的今天,高质量的训练数据已成为模型性能突破的关键。

2025-09-12 18:15:52 889

原创 WRC2025 | 澳鹏亮相2025世界机器人大会,以数据之力赋能具身智能新纪元

针对当前具身智能数据采集难、量级有限的痛点,澳鹏提出通过开放生态加速场景落地,并推出RoboGo具身智能数据开发平台,整合感知升维、认知建模和决策优化三大技术体系。

2025-08-25 16:39:53 504

原创 Cohere 如何为企业级模型扩展基于偏好的微调

为满足这一日益增长的需求,Cohere 打造了 PANDA Plus 项目 —— 一个用于偏好数据生成和奖励信号开发的计划,并与澳鹏(Appen)合作,以获取专业标注人员资源、支持实时模型反馈,同时为实验性和生产性微调提供以人为本的大语言模型训练数据。受监管行业的领先企业信赖 Cohere,将其用于面向客户和内部支持等场景,因此,该模型在从零售到银行业的多个领域中,生成有用、安全且与品牌定位一致的响应至关重要。要维持这一高标准,需要借助可靠的、与特定领域相关的人类反馈,进行持续的强化学习和微调。

2025-08-15 10:40:49 830

原创 在多语言大模型中保留文化细微差别:超越翻译

人工智能持续改变着全球交流,但高效的多语言人工智能不能只停留在逐字翻译的层面,还必须理解人类交流中不可或缺的文化细微差别。语言通过语音、文字等语言特征与社会语境之间的复杂关系传递信息。因此,准确的翻译必须考虑到交流发生时所涉及的文化、传统、价值观和身份认同。缺乏这种细微理解的人工智能可能会在无意中与用户产生沟通误解,甚至可能造成灾难性后果。开发具有文化智能的人工智能,要从具有代表性的高质量数据入手。如果人工智能系统仅依赖有限或单一来源的数据进行训练,就可能会忽视语言和表达中的关键差异。

2025-08-15 10:39:23 1282

原创 平台看点 | 澳鹏RoboGo具身智能数据开发平台:突破物理世界的AI边界

具身智能(Embodied AI)正迎来爆发式增长——从工业机器人到人形智能体,从实验室研究到千亿级市场落地,具身智能正在重塑AI与物理世界的交互方式。全球科技巨头与创新企业纷纷布局,大模型驱动的智能体正加速从“数字理解”迈向“物理执行”。具身智能正引领AI技术进入新纪元。在机器人、智能体、自动驾驶系统等领域快速发展的当下,如何让AI真正理解并适应物理世界,成为行业面临的核心挑战。高质量、多模态训练数据的匮乏,严重制约着具身智能的进化速度与应用深度。

2025-07-30 17:03:25 887

原创 WAIC2025 | 澳鹏(中国)精彩亮相2025世界人工智能大会

昨日,全球人工智能领域的顶级盛会——2025世界人工智能大会(WAIC 2025)在上海盛大收官。作为人工智能行业的“风向标”,本届大会以“智能时代 同球共济”为主题,汇聚了来自70多个国家和地区的1500余位顶尖专家,共同探讨AI技术的前沿突破、产业融合与全球治理,充分彰显了人工智能产业的蓬勃活力和全球影响力。人工智能之父、诺贝尔奖与图灵奖双料得主Geoffrey Hinton作为开场演讲嘉宾,分享了关于AI安全与发展的深刻洞见,呼吁全球协作培育“不会从人类手中夺权的好AI”,以推动技术向善发展。

2025-07-30 17:02:25 956

原创 澳鹏重磅发布MediGo医疗大模型数据开发平台 破解医疗AI数据瓶颈

澳鹏MediGo平台的技术创新主要体现在七个维度。在智能化标注方面,平台集成了医疗专用NER模型、问答对自动生成系统和自研预标注算法,包含药品信息OCR识别、骨骼/细胞形态预识别等医疗专用模型,大幅提升了标注效率和准确性。多模态工具的统一数据中台支持同时处理PDF、TXT、图片等多种数据格式,实现了跨模态数据的协同处理;内置的医疗专用接口,辅助提升标注效率。医疗影像工具采用2D/3D协同标注系统,通过智能色块追踪算法确保标注连贯性。平台还提供可视化模板设计器,支持快速创建符合不同研究需求的标注模板。

2025-07-16 14:29:51 309

原创 大语言模型评估:评估与提升LLM性能

评估是提升模型性能的关键。Appen的专业解决方案将人类智能与强大的LLM评估工具相结合,以增强LLM训练数据策略,并捕捉自动化指标常忽略的定性洞察。

2025-07-16 14:28:06 1027

原创 案例 | 全球70+种方言精调:解码多语言大模型的“地道“表达

科技巨头联手澳鹏Appen突破AI方言理解瓶颈,通过25万轮跨语言对话训练,成功优化多语言大模型在70余种方言变体中的表现。项目克服了小语种人才稀缺、文化适配和规模化质量控制三大挑战,组建母语专家网络,构建多维度评估体系,最终实现30+语种70+方言的精准覆盖。模型输出的文化适应性和语言准确性显著提升,用户满意度大幅提高。澳鹏Appen凭借20+语种全职团队和200+语言全球资源,持续推动AI语言理解边界。

2025-07-02 15:46:40 797

原创 澳鹏重磅发布MediGo医疗大模型数据开发平台 破解医疗AI数据瓶颈

澳鹏MediGo平台的技术创新主要体现在七个维度。在智能化标注方面,平台集成了医疗专用NER模型、问答对自动生成系统和自研预标注算法,包含药品信息OCR识别、骨骼/细胞形态预识别等医疗专用模型,大幅提升了标注效率和准确性。多模态工具的统一数据中台支持同时处理PDF、TXT、图片等多种数据格式,实现了跨模态数据的协同处理;内置的医疗专用接口,辅助提升标注效率。医疗影像工具采用2D/3D协同标注系统,通过智能色块追踪算法确保标注连贯性。平台还提供可视化模板设计器,支持快速创建符合不同研究需求的标注模板。

2025-07-02 15:43:55 410

原创 对抗性提示:进阶守护大语言模型

从核心来看,对抗性提示是精心设计输入以故意绕过或破坏人工智能安全机制的实践。这些并非普通笨拙的 “越狱” 尝试。如今的对抗性提示往往复杂、微妙且经过充分研究,它们利用心理学和语言学策略来诱使模型违反其对齐规则。与传统黑客攻击不同,这并非利用代码漏洞,而是利用语言 —— 这种使大型语言模型如此强大的交互界面。通过精心选择词语、语气或语境,用户可以让模型生成有害、有偏见或受限的内容,即使该模型已被明确训练为不生成此类内容。

2025-06-18 15:34:07 952

原创 澳鹏干货 | 基础模型选择指南:如何为生成式AI投资保驾护航?

在生成式AI (GenAI) 迅猛发展的今天,企业AI决策者正面临一个关键挑战:如何在纷繁复杂的基础模型 (Foundation Models) 中选择最适合自身业务的那一个?

2025-06-18 15:33:16 375

原创 澳鹏代码类数据集:下一代AI编程的“高能燃料“

当今大模型行业正迎来新一轮技术突破,高质量、高难度的训练数据成为推动AI推理能力飞跃的关键。在代码生成、算法优化等复杂任务中,普通难度的数据集已难以满足前沿模型的训练需求。澳鹏团队精心构建的高质量代码数据集,为模型提供从代码补全到系统架构设计的全栈训练支持。本期产品聚焦,我们将深入解析澳鹏代码类数据集,揭示其如何为AI模型提供从基础到高阶的全方位数据支持。

2025-06-04 16:56:33 374

原创 对抗性提示:大型语言模型的安全性测试

对抗性提示指通过精心设计的输入绕过LLM安全机制,诱导模型产生不安全或违反策略的输出。这类输入往往依赖语言技巧而非直接违规,使得常规审核工具难以识别。虚拟情境:将有害内容嵌套于虚构或假设性场景规避话术:使用模糊/间接表达绕过关键词过滤器提示注入:通过嵌入指令覆盖原始模型设定说服与持续施压:利用角色扮演、逻辑/权威诉求及反复改写瓦解模型的拒绝机制理解这些技术对评估模型鲁棒性及开发安全可信的AI系统至关重要。

2025-06-04 16:53:32 848

原创 工具看点 | 澳鹏多模态标注工具:构建AI认知的语义桥梁

在AI从单模态向多模态跃迁的时代,数据正经历着从孤立到融合的范式转变。当GPT-4o能理解图像中的幽默,Gemini可解析视频中的情感,这些突破背后是数据标注技术面临的崭新命题:如何让机器像人类一样,建立文字与视觉、声音与场景之间的深层语义关联?澳鹏全新升级的多模态标注工具,正是为解决这一核心挑战而生。作为专为跨模态AI训练设计的数据引擎,该工具重新定义了标注工作的维度——不再局限于单一模态的标记,而是构建起连接文本、图像、视频的立体语义网络。

2025-05-22 14:15:50 883

原创 案例 | 当AI学会“看图说话“:人类专家如何为视频描述生成器把关?

在视频内容爆炸式增长的今天,AI自动生成的视频描述本应成为创作者的得力助手,然而现实中常常出现"指鹿为马"的尴尬情况。其背后是AI在理解视觉内容和语言表达上的双重挑战。全球顶尖创意软件公司选择与澳鹏Appen合作,为其AI视频描述软件加装"人类智慧校验器"。一起走近本期案例故事。

2025-05-22 13:51:20 326

原创 澳鹏干货 | 动态判断:如何用“群体智慧“优化AI数据标注流程?

20世纪初,800人集体猜测一头公牛的重量,结果与真实数值误差不足1%——这就是著名的"群体智慧"效应。如今,这一古老智慧正以全新形态赋能AI训练:通过动态优化标注流程,让AI训练结果像人群一样达成精准共识。本期澳鹏干货将深入探讨:澳鹏Appen平台动态判断功能(Dynamic Judgments)如何将这一原理转化为生产力,在质量与效率间找到黄金平衡点。

2025-05-07 17:47:50 719

原创 澳鹏亮相2025中国生成式AI大会,以数据赋能大模型垂类应用新纪元

4月1日-2日,2025中国生成式AI大会在北京圆满举行,汇聚超过50位产学研界重量级嘉宾,深度解构DeepSeek引发的变革狂潮,全面展示深度推理模型、多模态模型、智能体及具身智能等前沿领域的最新进展。大会以"大拐点 新征程"为主题,吸引了1500余名现场观众,线上观看人次更是突破百万,成为国内AI领域最具影响力的产业峰会之一。澳鹏Appen作为AI数据服务行业的领军企业重磅亮相,分享了大模型时代数据服务的前沿洞察与实践经验。

2025-05-07 17:46:13 1344

原创 赋能顶尖AI平台:如何加速高质量AI音乐生成?

当一家领先的AI平台决定优化其AI音乐生成功能时,他们选择了与Appen合作。面对用户对个性化、高质量AI作曲日益增长的需求,该平台需要大量经过专业标注的音乐数据来训练模型,确保生成的旋律既符合流派特征又能引发情感共鸣。通过融合人类音乐专家的智慧,我们成功帮助客户缩短了产品上市时间,并显著提升了AI作曲的连贯性与风格适配性。

2025-04-16 18:16:52 509

原创 再获殊荣 | 澳鹏荣膺“数据要素ד· 数据标注行业领军企业

在数字经济加速发展的战略机遇期,由信息化观察网主办的“2025数据要素融合与应用创新峰会”作为行业权威盛会,聚焦《“数据要素×”三年行动计划(2024—2026年)》落地实施,通过行业典范成果发布,推动数据要素市场化配置改革向纵深发展。展望未来,澳鹏Appen将持续深化技术创新、优化服务质量,以更智能、更精准的数据解决方案赋能AI产业发展,携手行业伙伴共建高效、可信的数据服务生态,为人工智能和大模型技术的突破性发展提供坚实的数据基石。

2025-04-16 18:16:08 361

原创 AI安全:构建负责任且可靠的系统

AI已成为日常生活中无处不在的助力,随着AI系统能力和普及性的扩展,安全因素变得愈发重要。从基础模型构建者到采用AI解决方案的企业,整个AI生命周期中的所有相关方都必须共同承担责任。

2025-04-02 11:58:47 423

原创 工具看点 | 澳鹏GUI Tracker采集工具,Agent时代的数据利器

GUI Agent是一种基于多模态感知和大语言模型驱动的AI系统,能够通过自然语言指令在电脑/移动端实现自动化操作,如点击、输入、滑动等,从而完成复杂任务。其核心能力依赖于对用户交互行为轨迹的精准理解和执行,需要大量高质量的训练数据来支撑。近期,“开启AI智能体新时代”的Manus,凭借高效的界面操作能力和精准的任务执行表现,迅速成为行业焦点。

2025-04-02 11:56:36 1655

原创 大语言模型的多垂类快速评估与 A/B 测试

行业领先的模型构建企业携手澳鹏(Appen)开展了一项极具挑战性的项目。针对 3 至 6 个大型语言模型(LLM),在广泛的通用领域及复杂专业领域(如医疗保健、法律、金融、编程、数学和汽车行业等)中,进行了快速冲刺式的评估。依托澳鹏专业的评估团队和先进的人工智能数据平台,项目在紧凑的时间内高效推进。每个为期 5 天的冲刺阶段,完成超过 5 万条标注,最终累计完成了超 50 万条标注,有力地保障了模型的快速迭代与持续优化。这些评估全面考量了模型的准确性、相关性,同时确保其严格遵循负责任的人工智能标准。

2025-03-19 16:35:57 788

原创 深度 | 超级周期启动!AI数据服务龙头超前布局大模型技术平台与垂类知识

2025年初,开源大模型DeepSeek横扫全球科技界后迅速向所有经济领域扩散,成为经济效率和增长的新基座。麦肯锡的2023年6月报告认为,在大模型和生成式AI的影响下,AI每年可为全球带来生产力提高0.1%-0.6%。高盛在2025年3月发布观点,认为在DeepSeek-R1的影响下,未来十年AI的广泛普及,有望推动中国上市企业股票整体盈利每年提高2.5%。

2025-03-19 16:34:49 1206

原创 数据高质量与合规,守护AI模型的真实未来

在人工智能(AI)技术迅猛发展的今天,高质量的数据已成为推动AI模型进步的核心要素。然而,随着合成数据(Synthetic Data)的广泛应用,数据质量和伦理问题日益凸显。欧盟《人工智能法案》(EU AI Act)明确要求高风险AI系统的训练和评估数据必须经过人类验证。本期澳鹏干货将深入探讨Appen AI Detector功能如何从源头把控数据质量,确保AI模型训练数据真实、可靠。

2025-03-04 17:51:02 501

原创 从Grok-3霸榜谈起:高难度题库如何助力AI推理能力飞跃?

马斯克口中“全世界最聪明的大模型”Grok-3正式亮相!在多项基准测试中,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o等强劲对手。除了20万块GPU带来的“大力出奇迹”,Grok-3还结合了合成数据、多模态数据、自我修正机制和人类反馈等先进技术,使其在推理能力、多模态处理和复杂任务解决方面达到了新的高度。这些训练数据的多样性和高质量为Grok-3的卓越表现奠定了坚实基础。

2025-03-04 17:50:03 1073

原创 DeepSeek的成功,真的抛弃了SFT吗?

近期,DeepSeek在AI领域备受关注,其出色的复杂逻辑推理能力令人印象深刻。有人声称,R1完全抛弃了路线,纯靠强化学习就达到了与o1相当的水平。然而,DeepSeek的成功真的完全抛弃了SFT,尤其是复杂领域的SFT了吗?我们将通过一个实际案例,深入探讨这一技术的应用与价值。

2025-02-19 16:49:17 1105

原创 通过监督微调提升多语言大语言模型性能

该项目从最初的5种以上语言、10多种方言,扩展到如今的30多种语言、70多种方言,大大提升了模型回复在文化契合度和语言准确性方面的表现。此项目聚焦于提升大语言模型在众多方言(如阿拉伯语、中文、德语、俄语和西班牙语等)环境下生成高质量回复的能力,使其能够针对不同语言群体,输出更准确、贴合语境且流畅的内容。该项目需要高质量的多语言和多方言提示。通过利用人们的偏好排序和结构化微调,澳鹏帮助客户优化了他们的大语言模型,使其对全球用户的响应更加出色,能够在广阔的语言领域中提供贴合语境且准确的回复。

2025-02-19 16:40:25 842

原创 掌握大语言模型:面向AI领导者的深度研究

大语言模型(LLMs)正在彻底变革各行各业——LLM能够自动化执行任务、生成创意内容,还能让企业更高效地管理知识。然而,若要充分挖掘其潜力,就必须深入了解LLM的能力、面临的挑战以及应用场景。,深入剖析大语言模型的运作原理、高质量训练数据的重要性,以及企业在快速发展的人工智能领域中保持竞争力的策略。

2025-02-05 15:49:44 485

原创 澳鹏CEO寄语 | 年度回顾与未来之路

在迈入2025年之际,前方的无限可能令我倍感振奋。今年的成就再次巩固了我们作为行业领导者的地位,而我们克服的种种挑战,则让我们变得更强大、更敏捷。我们将携手继续为客户提供无与伦比的价值,支持员工成长,并为投资者创造可持续的成功。愿2025光明璀璨、充满变革与机遇。

2025-02-05 15:48:41 853

原创 再获殊荣 | 澳鹏荣获亿欧“2024中国数据要素服务商TOP20”

2024年12月18日-20日,以“AI For X 未来产业范式跃迁”为主题的亿欧WIM2024创新者年会正式拉开帷幕。会上,亿欧“世界创新奖(WIA)”系列榜单正式发布,该榜单是专家组委会从中国及海外各行业上千家候选企业中,筛选出最具开创精神的企业而设立,以表彰其在领域内不懈的创新精神和杰出的发展成绩。经过对数据要素企业品牌影响力、技术研发实力、商业化能力等因素的综合考虑,澳鹏Appen凭借高质量的产品研发和服务水平在本次评选中脱颖而出,成功荣登“2024中国数据要素服务商TOP20”。

2025-01-15 14:47:39 326

原创 如何让罕见语言的使用者也能参与到全球对话?

对于罕见语种的使用者而言,如何确保知识获取的公平性?早期的在线翻译软件笨拙呆板,逐字直译,往往导致对语言细微差别的严重误解。而目前在一众翻译软件中,由Azure AI技术支持的微软翻译帮助实现了多语言间的无缝沟通和跨文化交流。扩展语言能力,尤其是罕见语种,是微软翻译面临的一大挑战。目前,微软翻译支持110种语言,其中,澳鹏Appen为其108种语言提供数据支持。一起来走进今天的案例故事。

2025-01-15 14:46:43 900

原创 干货分享 | 什么是大模型思维链?

这种方法非常适合对模型进行推理能力训练,因为三元对数据(问题,推理链,答案)构成的多组数据可以为模型复现推理链提供更多参考,更高效地提高模型的推理能力。最近的一项研究表明,Google Research 团队发现,思维链数据集训练后的模型,对小学数学的解决准确率达到了57%,远远高于用基础问题&答案数据集训练出来的模型(18%)。澳鹏为您的思维链训练提供全面的数据支持,包括微调数据集(即三元对数据,包含问题,推理链,答案),创建思维链提示,以及内容评分等,为您的模型推理能力提升进行闭环支持。

2024-12-30 17:12:57 1179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除