近日,数据智能应用服务商蜜度midu.com发布了人工智能前沿应用成果——跨模态检索引擎MiduCMR,实现从数据融合到实际应用的重大突破。
MiduCMR利用跨模态对比学习、语义融合、语义表征、语义检索等技术,实现了跨模态视频打标签、相似视频检索、场景识别等一系列解决方案,为政企与媒体数字化转型提供场景化的数据智能服务。跨模态信息检索与数字媒体如何产生“化学反应”?
01跨模态信息检索——多模态信息交互的桥梁
何为“跨模态信息检索”?“跨模态信息检索”通常指从互联网的全媒体多模态信息中,提取视频、音频、图片、文本内容并对其进行单模态理解和多模态融合。
例如以文本搜图片、音视频,以图片搜文本、视频,以音频搜文本、视频等,其难点在于自动理解、关联不同模态数据之间的关键要素,并实现相对准确的交叉匹配。
02善用跨模态信息检索——全媒体助跑工具
智能媒体时代,媒体形态较从前有了颠覆性转变,信息传播系统亦不断更新迭代。在复杂多变的环境下,媒体工作者如何应对网络中海量的碎片化信息,如何兼顾媒体内容生产者与媒体信息传播者的二重身份,成为一大挑战。
MiduCMR跨模态信息检索,以“一己之力”让媒体工作者实现高效信息交互,助力媒体资源整合。
< 信息精准溯源 事件真伪辨别 >
如何快速、准确地聚焦热点话题及背景信息,是媒体从业者跑赢信息发布速度的一大关键。然而,碍于信息传播误差、事件地点距离过远等多种因素,如何追溯真实准确的信息源,