• 博客(153)
  • 收藏
  • 关注

原创 【论文解读】大模型与游戏-综述和路线图

近年来,对大型语言模型(LLM)的研究出现了爆炸式的增长,同时伴随着公众对这一话题的参与。虽然LLM最初是自然语言处理中的一个领域,但它在包括游戏在内的广泛应用和领域中都显示出了非凡的潜力。本文调查了LLM在游戏中的各种应用程序的现状,并确定了LLM在游戏中可以扮演的不同角色。重要的是,作者讨论了LLM在游戏中未来使用的未开发领域和有希望的方向,并提出了LLM在游戏领域中的潜在和局限性。作为LLM和游戏交叉点的第一个全面调查和路线图,希望本文能够在这一令人兴奋的新领域为开创性的研究和创新提供基础。

2024-05-22 10:00:00 640

原创 效率提升超30% ,合合信息智能文档处理技术赋能央企保理公司供应链审单

近日,合合信息与某央企保理公司达成合作,在智能文档处理技术的加持下,通过合同机器人等产品,对供应链贸易场景下的各类票证、合同进行场景化识别、关键信息抽取与智能审核,提升资金审批效率及放款速度,助力央企保理公司供应链金融管理效率的升级。

2024-05-15 10:28:38 396

原创 合合信息携手业界专家,解码数据资产管理方法与入表的关键路径

随着财政部印发的《企业数据资源相关会计处理暂行规定》提出企业数据资产入表相关办法,《数据资产评估指导意见》中进一步规范数据资产评估行为,细化数据资产评估操作要求,对解决数据要素市场建设中的“数据赋值”难题提供了有效方案。数据资产管理与入表成为当前社会关注热点和数据资产行业的兴奋点。有鉴于此,上海国家会计学院联合上海数据交易所、上海市数商协会,推出的“数据资产研修班”旨在全面解读政策、深入研讨典型案例,加速企业数字化战略转型。近期,研修班走进合合信息,与天职国际会计师事务所共同交流数据资产入表与管理方法。

2024-05-14 10:29:28 569

原创 这款PDF解析工具,精准触达大模型问答应用的需要

过去的一年,是大语言模型快速发展的一年。大模型强大的语言理解能力,逐渐让用户习惯了将各类文章丢给大模型,让它来帮忙总结提炼。从产品角度看,这是一次10倍体验的飞跃,意味着巨大的市场机会。也因此,市面上涌现出了大量的文档+大模型的应用。但大多数的开发者普遍都会遇到一个问题,那就是各种文档的效果都想做好,兼容起来太麻烦了,有没有更好的解决方案?以PDF为例,通常大家会尝试选择开源工具,比如PyPDF2,但发现它们对中文的支持都不太好;

2024-05-11 10:00:00 1615 34

原创 突破内外数据融合场景堵点,合合信息启信宝赋能银行对公业务数智化建设

合合信息旗下启信宝凭借在银行对公营销、信贷风控、运营管理等核心场景的数据应用优势,入选报告《数据要素X金融服务》优秀场景应用案例。

2024-04-29 10:25:27 286

原创 论文解读-面向高效生成大语言模型服务:从算法到系统综述

在快速发展的人工智能(AI)领域中,生成式大型语言模型(llm)站在了最前沿,彻底改变了论文与数据交互的方式。然而,部署这些模型的计算强度和内存消耗在服务效率方面带来了重大挑战,特别是在要求低延迟和高吞吐量的场景中。本调查从机器学习系统(MLSys)研究的角度,解决了对高效LLM服务方法的迫切需求,这是先进人工智能创新和实际系统优化的关键。

2024-04-26 10:31:17 896

原创 AI将诗意装进口袋!合合信息扫描全能王“扫描书籍”功能优化上线

人间最美四月天,正是读书好时节。4月20日至23日,正值“世界读书日”之际,合合信息旗下扫描全能王联合上海首家图像小说主题书店——安古莱姆书店,共同发起“春天正是读书天”线下公益阅读活动,为公众带来一场春日文学盛宴。

2024-04-23 14:14:21 280 1

原创 免费在线OCR识别工具TextIn Tools,开启智能学习新时代

同学,你是否还在苦恼笔记必须手写摘抄?带字照片只能插入文档?PDF转换要花钱买会员?今天给大家带来一款既好用又免费的在线OCR识别工具tools.textin.com,它不仅仅具有文字和表格识别工具,还包含PDF转文件等工具,一站式服务为你解决所有问题。

2024-04-17 10:44:24 4255 61

原创 科技助力上亿用户隐私安全保护,合合信息两款产品再获CCIA PIA星级标识

随着互联网技术的飞速发展,个人信息的收集、存储、使用和传输变得日益频繁,其泄露和滥用的风险也随之增加,个人信息保护已成为社会共同关注的热点议题。近期,“中国网络安全产业联盟(CCIA)数据安全工作委员会”“数据安全共同体计划(DSC)”等组织共同发起了第二批评估工作——“个人信息保护影响评估专题工作(简称‘PIA专题工作’)”,合合信息旗下的名片全能王、启信宝等产品获得了“PIA二星级标识”。

2024-04-16 10:03:41 382

原创 【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

在当今的数字化时代,电子文档已成为信息存储和交流的基石。从简单的文本文件到复杂的演示文档,各种格式的电子文档承载着丰富的知识与信息,支撑着教育、科研、商业和日常生活的各个方面。随着信息量的爆炸性增长,如何高效、准确地处理和分析这些电子文档,已经成为信息技术领域面临的一大挑战。在这一背景下,电子文档解析技术应运而生,并迅速发展成为智能文档处理技术中的一个关键组成部分。

2024-04-15 10:33:15 1101 38

原创 合合信息分享数据资产管理经验,释放数据要素价值,发展新质生产力

为加快推动产业数据行业创新中心建设、搭建高效的供需对接平台,4月9日,上海数据交易所、上海合合信息科技股份有限公司(下称“合合信息”)和上海市数商协会联合举办DSM系列——产业数据行业创新中心专题研讨会,以“数据资产管理与创新应用”为主题,探讨产业数据产品化、资产化,共促产业数据流通交易,共拓数据资产创新应用新机遇。

2024-04-11 15:30:12 529

原创 【论文解读】大模型事实性调查(下)

论文的讨论过渡到评估LLM事实性的方法,强调关键指标、基准和研究。论文进一步探索了增强LLM事实性的策略,包括针对特定领域的方法。论文主要关注两种主要的LLM配置——独立的LLM和利用外部数据的检索-增强的LLM——论文详细介绍了它们所面临的独特挑战和潜在的增强功能。论文的调查为研究人员提供了一个结构化的指导,旨在加强llm的事实可靠性。

2024-04-10 10:46:30 932

原创 【论文解读】大模型事实性调查(上)

本调查探讨了大型语言模型(llm)中的事实性的关键问题。随着llm在不同领域的应用,其输出的可靠性和准确性变得至关重要。论文将“事实性问题”定义为llm产生与既定事实不一致的内容的概率。

2024-04-08 13:54:58 1035

原创 合合信息推出国央企智能文档处理解决方案,AI赋能信创国产化

近期,合合信息基于人工智能技术推出国央企智能文档处理解决方案,通过场景智能文字识别引擎等产品,为国央企提供从多版式票证识别服务到文档数据分析全流程服务。此外,方案还通过智能文字识别训练平台,降低国央企文档文字识别模型开发门槛,助力国央企数字化转型和信创国产化落地。

2024-04-03 11:07:27 965

原创 【合合TextIn】AI构建新质生产力,合合信息Embedding模型助力专业知识应用

现阶段,大语言模型的飞速发展吸引着社会各界的目光,背后支撑大型语言模型应用落地的Embedding模型也成为业内关注的焦点。近期,合合信息发布了文本向量化模型acge_text_embedding(简称“acge模型”),获得MTEB中文榜单(C-MTEB)第一的成绩。

2024-04-01 10:30:13 1595 56

原创 启信宝商业大数据助力全国经济普查

近日,合合信息旗下启信宝收到中国青年创业就业基金会感谢信,对启信宝协同助力全国经济普查和服务青年创业就业研究表达感谢。

2024-03-29 15:26:41 457

原创 【合合TextIn】OCR身份证 / 银行卡识别功能适配鸿蒙系统

自鸿蒙系统推出以来,其不仅成为了华为在软件领域的重要里程碑,更是国产操作系统的一面旗帜,也是国产移动平台几乎唯一的选择,标志着中国在构建独立自主的软件生态体系上迈出了重要一步。随着鸿蒙操作系统的迅速崛起和信创国产化战略的深入推进,市场对兼容国产软件生态的需求日益增长。在这样的大背景下,合合信息两款最热门的OCR产品——身份证识别和银行卡识别——已经全面完成对鸿蒙系统的适配。

2024-03-26 10:30:00 2527 44

原创 【合合TextIn】深度解析智能文档处理技术与应用

智能文档处理的发展离不开机器学习、深度学习、OCR(光学字符识别)和自然语言处理等关键技术的进步。早期的文档处理主要依赖于模板匹配和规则-based的方法,这些方法在处理结构化文档时效果不错,但面对复杂的非结构化文档时则显得力不从心。随着深度学习技术的突破,尤其是卷积神经网络(CNN)和循环神经网络(RNN)在图像识别和文本处理领域的应用,使得IDP技术能够更加精准地识别和理解文档内容。此外,BERT、GPT等预训练语言模型的出现,进一步推动了IDP技术在理解复杂语言结构和语义上的能力。

2024-03-22 10:33:17 1653 60

原创 合合信息扫描全能王亮相静安区3·15活动,AI扫描带来绿色消费新体验

保护消费者的合法权益,是全社会的共同责任。为优化消费环境、促进品质消费高地建设,打造安全优质和谐的消费环境,上海静安区消保委于3月15日举办静安区2024年“3·15”国际消费者权益日活动。在消费体验区,合合信息作为科技企业代表,给消费者们带来了别开生面的智能文档扫描体验。工作人员现场演示了通过智能文字识别技术将古老的甲骨文转化为现代文字的过程。智能文字识别技术可以帮助考古工作者识别残缺、不易辨别的甲骨文,这不仅是科技对传统文化的致敬,更是科技在考古、文化保护等领域应用的生动展现。

2024-03-19 15:43:36 346

原创 合合信息旗下启信宝3·15黄金市场洞察:新增企业量5年连降

日前,合合信息旗下启信宝基于产业链数据库,从全国黄金企业中珠宝首饰设计相关企业(下称“黄金珠宝企业”)的存续情况、新增情况、区域表现等数据进行分析洞察,通过商业大数据帮助消费者研判黄金珠宝产业发展前景,让消费回归理性。

2024-03-14 14:27:38 903

原创 扫描全能王发布2023“绿色数据”:减碳超12万吨,相当于多种700万棵树

植树节将至,合合信息旗下扫描全能王发布了年度用户文档扫描数据(简称“数据”)。数据显示,2023年,扫描全能王中国区用户使用扫描功能超10亿次,累计节省碳排放量超12万吨,相当于多种超700万棵树。

2024-03-12 10:45:20 441

原创 【论文解读】多模态大语言模型综述

本文旨在对MLLM的最新研究进展进行跟踪和总结。首先,论文提出了MLLM的公式,并描述了它的相关概念。然后,论文讨论了关键的技术和应用,包括多模态指令调整(M-IT)、多模态上下文学习(M-ICL)、多模态思维链(M-CoT)和LLM辅助视觉推理(LAVR)。最后,论文讨论了现有的挑战,并指出了很有前景的研究方向。鉴于MLLM的时代才刚刚开始,作者将继续更新这项调查,并希望它能激发更多的研究。

2024-03-12 10:31:44 2106 59

原创 合合信息入选上海市网信办“2023年度网络数据安全风险评估试点工作优秀单位”

近日,试点工作组召开了工作总结暨座谈交流会(简称“会议”)。会议指出,数据安全事关国家安全、事关高水平对外开放、事关高质量发展,要深刻把握数据安全工作的新形势新要求。会议通报了本次试点工作的优秀单位及优秀案例。上海市水务局、解放日报社、国泰君安、合合信息等企事业单位获评“2023年度网络数据安全风险评估试点工作优秀单位”。

2024-02-29 17:39:47 438

原创 元宵节家里煮了多少汤圆?合合信息扫描全能王“拍照计数”一键盘点

近期,合合信息旗下扫描全能王APP“拍照计数”功能获得广大用户的关注。该功能基于图像AI技术,可以对图片中用户指定的目标物体进行统计,快速“点出”出图片中的物体数量。想要大致数清汤圆、饺子、车厘子、苹果等年货的数量,只需轻轻一拍,答案即可呈现。

2024-02-24 15:00:00 374

原创 【论文解读】transformer小目标检测综述

本综述论文回顾了60多篇研究论文,专注于开发小目标检测任务的transformer,包括纯基于transformer和集成cnn的混合技术。这些技术已经从七个不同的角度进行了研究:目标表示、用于高分辨率或多尺度特征图的快速注意机制、架构和块的修改、时空信息、改进的特征表示、辅助技术和完全基于transformer的检测。这些类别都包括几种最先进的(SOTA)技术,每一种都有自己的优点。

2024-02-22 10:34:00 2115 64

原创 想好新年去哪了吗?合合信息扫描全能王用AI“留住”年味

还有不到十天,除夕就要到了。近几年春节假期中,有人第一次带着孩子直击海面冰风,坐船回老家;也有人选择“漫游”国内外,在旅行中迎接新春的朝气。合合信息旗下扫描全能王APP通过AI扫描技术,提供了一种全新的“年味记录”方式,帮助用户留住温暖的瞬间。

2024-02-02 17:04:28 428

原创 入境游火了!合合信息扫描全能王“扫描证件”功能获海外用户追捧

合合信息旗下扫描全能王可有效解决各类签证申请材料扫描中存在的歪斜、阴影、模糊等难题,为用户提供清晰的文件图片,让签证申请流程更顺畅。

2024-01-30 09:54:02 457

原创 合合信息启信数据发布园区金融解决方案,助力银行精准服务“十四五”特色产业

近期,合合信息旗下启信数据发布了园区金融专项解决方案(简称“园区金融解决方案”),通过商业大数据和人工智能技术,助力银行精准锚定目标园区及企业,用金融“活水”培育产业“沃土”。

2024-01-25 10:50:26 404

原创 【论文解读】用于代码处理的语言模型综述

论文系统地回顾了在代码处理方面的最新进展,包括50个+模型,30个+评估任务和500个相关工作。论文将代码处理模型分解为由GPT家族表示的通用语言模型和专门预训练的代码模型,通常具有定制的目标。论文讨论了这些模型之间的关系和差异,并强调了代码建模从统计模型和rnn到预训练的transformer和LLM的历史转变,这与NLP所采取的过程完全相同。还讨论了特定于代码的特性,如AST、CFG和单元测试,以及它们在训练代码语言模型中的应用,并确定了该领域的关键挑战和潜在的未来方向。

2024-01-18 10:32:19 1994 57

原创 “五星卡”上新!合合信息“外国人永久居留身份证”识别产品助力金融机构提升服务效率

“五星卡”是办理金融、教育、医疗、交通、住宿、通信、工作、税收和社会保险、财产登记、诉讼等事务的关键材料之一,金融、交通、政务相关机构亟须在信息系统、线上应用程序与服务平台等层面,将永居证纳入可识别的身份证件类型。合合信息率先上线外国人永久居留身份证识别产品,助力永居证适配性改造与便利化应用。

2024-01-17 09:56:52 486

原创 入选人民网2023普惠金融优秀案例,合合信息旗下启信宝赋能银行对公信贷数字化转型

针对银行在普惠金融落地过程中存在的获客难、触客难、内部授信流程复杂等问题,合合信息旗下启信宝推出了银行对公业务数字化升级解决方案(简称“银行对公数字化方案”),在“启信天元大数据应用平台”的支持下,创新性将商机获取、尽职调查、客户触达与跟踪、运营管理等流程融为一体,并通过对接银行CRM系统,高效低成本助力银行“活客”“获客”。 同时,依托丰富的大数据资源,方案可助力金融机构高效开展专项信贷业务,为发展普惠金融提供技术和数据支撑。

2024-01-12 10:52:42 511

原创 CSIG青年科学家会议圆满举行,合合信息打造智能文档处理融合研究新范式

近期,第十九届中国图象图形学学会青年科学家会议(简称“会议”)在广州召开。会议面向国际学术前沿与国家战略需求,致力于支持图象图形领域的优秀青年学者,提供学术交流与研讨的平台,促进学者之间的交流与合作,鼓励图象图形领域的“产学研”合作。论坛上,合合信息智能技术平台事业部副总经理、高级工程师丁凯博士对GPT-4V在文档处理领域的实际表现进行了解析,并对公司在智能文档处理领域的研究工作进行了分享。

2024-01-05 17:07:38 394

原创 【论文解读】模型即服务-MaaS中所涉及的关键技术

本文对MaaS在各个行业的意义及其意义进行了全面的概述。论文简要回顾了基于云计算的“x即服务”的开发历史,并介绍了MaaS中所涉及的关键技术。GenAI模型的发展将变得更加民主化和繁荣。论文还回顾了MaaS的应用研究。最后,作者强调了这一前景领域的几个挑战和未来问题。MaaS是针对不同的基于人工智能的模型的一种新的部署和服务范式。论文希望本综述能对MaaS领域的研究提供启示。

2023-12-28 15:31:22 2261 41

原创 扫描全能王启动鸿蒙原生应用开发,系HarmonyOS NEXT智能扫描领域首批

近期,“鸿蒙合作签约暨扫描全能王鸿蒙原生应用开发启动仪式”(简称“签约仪式”)正式举行。合合信息与华为达成鸿蒙合作,旗下扫描全能王将基于HarmonyOS NEXT正式启动鸿蒙原生应用开发。据悉,扫描全能王是鸿蒙在智能扫描领域内签约原生应用开发的头部产品,双方拟在以OpenHarmony为底座的HarmonyOS上构建应用及服务,携手为用户带来更优质的服务体验,实现成果共享、商业共赢。

2023-12-26 14:29:30 308

原创 【论文解读】System 2 Attention提高大语言模型客观性和事实性

基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正这些问题,论文引入了System 2 Attention(S2A),它利用LLM的能力,用自然语言进行推理,并遵循指示,以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分,然后再处理重新生成的上下文以引出最终响应,增加了事实性和客观性,减少了虚假性。

2023-12-13 11:09:15 338

原创 即拍即改!合合信息旗下扫描全能王推出首个移动端图片文字编辑功能

近期,合合信息旗下扫描全能王APP“编辑文字”新功能正式上线。在AI智能扫描引擎的支持下,该功能可自动识别、修改图片中的文本,为使用者提供更便捷、更高效的文字处理体验,用户只需打开手机,便可轻松完成指尖上的编辑",无需因为细微的调整而耽误项目的进度。

2023-12-12 14:53:30 137

原创 合合信息旗下启信宝与鹏城实验室达成数据托管合作,“AI靶场”让数据管理更精准

数据安全层面,鹏城实验室AI靶场与深数所的合作将充分发挥各自的优势,共同打造一个高效、安全的数据托管机制,为数据供给方提供安全托管的保障,同时为数据需求方提供挖掘真实场景真实数据的充分支持。鹏城实验室新型网络研究部基于实验室领域战略科学家、中国工程院院士方滨兴提出的“数据不动程序动、数据可用不可见、分享价值不分享数据、保留所有权释放使用权”隐私保护新理念,通过“鹏城云脑”,打造安全可信的数据共享空间——AI靶场,构建了一套全自主可控的安全保障和内容审核机制,为数据共享使用搭建了一个安全的模型加工场。

2023-12-07 11:35:39 129

原创 文档理解的新时代:LayOutLM模型的全方位解读

在现代文档处理和信息提取领域,机器学习模型的作用日益凸显。特别是在自然语言处理(NLP)技术快速发展的背景下,如何让机器更加精准地理解和处理复杂文档成为了一个挑战。文档不仅包含文本信息,还包括布局、图像等非文本元素,这些元素在传递信息时起着至关重要的作用。传统的NLP模型通常忽略了这些视觉元素,但LayOutLM模型的出现改变了这一局面。LayOutLM模型是一种创新的深度学习模型,它结合了传统的文本处理能力和对文档布局的理解,从而在处理包含丰富布局信息的文档时表现出色。

2023-11-29 10:44:53 286

原创 上海数交所与合合信息发布产业数据行业创新中心,政产学研合力为“数据航母”加速

数据要素市场的培育、价值的提升,首先需要确定数据要素资产产权权利;中心重点推出了“供应链数据要素跨域融合平台”(简称“平台”),汇集了大型集团企业平台、产业互联网平台、工业企业及工业互联网平台等多源第三方数据,通过国内首个基于数据空间技术形成的数据交易创新模式进行数据融合建模,在满足产业发展和普惠金融相关数据需求的同时,帮助数商更快捷地进行数据商业化。从微观层面看,每个产业主体都会产生属于自己的独特数据,且其中大部分以私域的形式进行保存,例如供应链数据、交易数据、票据数据、履约数据、生产数据、工业数据等。

2023-11-28 13:33:07 124

原创 【论文解读】在上下文中学习创建任务向量

目前还不清楚ICL是否以这种方式运行,因为预测是通过T([S,x])执行的,其中T通常是一个自回归transformer,而[S,x]是S和x中的令牌的连接。受学习理论的假设类观点的启发,论文的目标是了解ICL是否将演示集S映射到查询x上的一个函数,以及这个映射是如何发生的。论文的实证研究结果表明,这一观点是适用的,阐明了假设空间的结构,其中ICL可以被看作是运作的。在这里,论文提供了支持这种解释的证据。可以看出,同一任务中的向量比不同任务之间的向量更接近,说明θ在任务中是稳定的,不受x'或S的高度影响。

2023-11-23 14:25:27 194

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除