- 博客(1322)
- 收藏
- 关注
转载 十年十篇 • 数启新程:《大数据与计算模型》
指出了大模型的重要标志是机器涌现智能,强调大模型的本质是“压缩”;《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。
2026-01-27 16:16:21
1
转载 十年十篇 • 数启新程:《基于多模态大模型的具身智能体研究进展与展望》
随着多模态大模型的发展,具身智能体具备了更强的语言理解、推理判断和环境感知能力,极大地推动了该领域的发展。张旭龙,男,博士,平安科技(深圳)有限公司高级算法研究员,复旦大学计算机理学博士,主要研究方向为语音合成、语音转换、音频驱动虚拟人生成、音乐信息检索以及机器学习和深度学习方法在人工智能领域应用,担任清华大学深圳研究院以及中国科学技术大学先进技术研究院校外导师,目前是IEEE、中国自动化学会以及中国计算机学会会员,担任联邦数据与联邦智能专委会委员,2023年入选上海市东方英才计划青年项目。
2026-01-23 16:16:46
11
转载 《大数据》期刊首届青年编委会诚邀您的加入!
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。促进学术传播:通过学术网络推荐优质稿源、扩大期刊学术影响力;
2026-01-15 16:17:05
34
转载 【专题征文】高质量数据集构建及治理(截稿时间:2026年4月30日)
然而,高质量数据集的构建与治理面临着诸多挑战,包括但不限于数据来源的多样性、数据质量的参差不齐、数据隐私与安全的保护及数据生命周期的有效管理等。同时,数据治理作为保障数据质量、促进数据共享与利用的重要途径,对于提升组织的数据资产价值、支持数据驱动的决策制定具有不可估量的作用。因此,本专题围绕“高质量数据集构建及治理”进行征文,旨在集中展示高质量数据集构建及治理的最新理论研究、技术方法、系统平台与实践案例等,为相关领域的研究者与实践者提供一个分享平台,共同推动大数据与人工智能技术的飞速发展与应用创新。
2026-01-12 14:07:10
23
转载 【专题征文】《大数据》专题“大模型训推数据存储”征文(截稿时间:2026年5月31日)
然而,在大模型技术快速演进与产业加速落地的背景下,存储系统已成为制约行业突破的核心瓶颈:训练阶段需支撑超大规模数据的高并发加载与高频检查点读写;作为智能算力基础设施的核心支撑,存储系统的性能与效率直接影响着大模型的训练迭代速度、推理服务质量与规模化部署能力,已成为支撑人工智能产业高质量发展的关键数据底座。征文内容包括但不限于:训练数据的高效存储与读取、检查点数据的高性能读写与压缩、键值缓存的高效管理与加载、推理系统中向量检索的存储优化。张广艳 清华大学长聘副教授。大规模训练数据的存储与读取;
2026-01-08 16:16:57
23
转载 市域数据要素市场构建路径探索:无锡创新实践的经验与启示
无锡地处长江三角洲几何中心,依托米码头、布码头、丝码头、钱码头等历史经验,充分发挥资源禀赋和产业特色,创新提出“1+8+X”数据要素市场建设模式,全力建设具有市场化配置高、安全权益高、流通成本低“两高一低”显著优势的“中国数码头”,吸引国内国际数据到无锡存储、加工、流通、交易,解决了当前国内数据市场规则缺乏、数据供给不优、平台互通不畅、产业载体不足等普遍存在的难题,取得了积极进展与成效,为大中型城市建设数据要素市场提供了重要经验借鉴。,打造基于隐私计算、区块链的可信交易环境,实现数据流通交易的闭环管理;
2026-01-05 16:17:06
38
转载 辞旧迎新,喜迎元旦|《大数据》编辑部恭祝您节日快乐!
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。关注《大数据》期刊微信公众号,获取更多内容。
2026-01-01 09:01:30
20
转载 基于图检索增强生成和少样本学习的美术作品鉴赏
刘天扬1 寇思佳2 金旭3 王文静3 陆雪松1(1. 华东师范大学数据科学与工程学院,上海 200062;2. 教育部教育技术与资源发展中心(中央电化教育馆),北京 100032;3. 北京师范大学附属实验中学,北京 100032)摘 要 随着我国素质教育的不断推进,美术教育在学科教育中的影响越来越大。美术作品鉴赏是美术教育的重要内容之一,能够培养学生的美术能力和素养。然而,优秀美术教师的缺乏和各地区美术教育发展水平的不平衡,导致众多学生无法受到高质量的美术作品鉴赏教育。在这种情况下,利用多模态大语言模型辅
2025-12-25 16:16:18
51
转载 学习者学习行为建模:一种基于预训练模型的可解释性知识追踪模型
本文以题目难度为切入点,通过Bert模型预测题目文本内容中隐含的题目难度等级,增强了数据的可解释性,提出基于Transformer架构的高性能可解释KT模型,将模型预测过程分解为题目难度预测与学习者能力预测,IRT模块基于这两个解释参数预测学习者正确回答概率。未来的研究将聚焦于多知识概念下不同知识概念难度与题目难度的关系,通过题目文本等辅助信息预测出不同知识概念难度,为学习者提供更深入的指导,同时,分析学习者在掌握该知识点后却连续出现错误的原因并建立预警模型,也是后续的研究重点。
2025-12-22 16:16:48
61
转载 面向教育场景的视觉大模型优化与应用
许跃蓬1,2 徐柴迪3 郭晋军1 姜云桥4 王仕嘉1 刘垚1,2,5(1. 华东师范大学数据科学与工程学院,上海 200062;2. 先进计算与智能工程国家级重点实验室,江苏 无锡 214000;3. 上海孔棣科技有限公司,上海 201204;4. 摩尔线程智能科技(成都)有限公司,四川 成都 610031;5. 软硬件协同设计技术与应用教育部工程研究中心(华东师范大学),上海 200062)摘 要 随着人工智能技术的迅速发展,大语言模型在许多领域取得了显著成功,但在教育领域的应用仍面临多模态数据处理困难、
2025-12-15 16:17:05
83
转载 CrownCom2025 Call for papers
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。认知无线电与工业互联网、情感计算、定位技术交叉领域的相关标准与倡议;
2025-12-12 16:16:46
42
转载 《大数据》创刊十周年纪念座谈会暨第三届编委会第四次会议顺利召开
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。十载奋进,春华秋实。,对《大数据》十年来取得的成绩表示了肯定和赞扬,
2025-12-03 16:16:54
43
转载 基于知识增强大语言模型的历史学科试题生成系统
随着大语言模型的问世,其凭借强大的语言能力和推理能力能够模仿教师的题目设计方法,对出题材料进行分析并生成相应题目,并通过自我检查保证生成题目的质量。随着大语言模型的兴起,研究者们逐渐采用更加灵活的方式,将知识图谱的信息通过提示词(prompt)的形式输入大语言模型,从而增强其知识基础,缓解模型生成时的“幻觉”现象,并提升模型在特定领域,尤其是教育领域中的应用效果。知识图谱检索模块利用知识图谱中的丰富历史关系信息对大语言模型进行增强,补齐大语言模型的专业知识并使生成的题目更加多样,满足教师的使用需求。
2025-12-02 16:16:29
71
转载 首发!支撑教育数字化转型的平台:现状与愿景
余理娜1,2 高明2,3 董启文2,3 周傲英2,3(1. 贵州睿秀科技有限公司,贵州 贵阳 550025;2. 贵州筑文华东师大数据动力研究院,贵州 贵阳 550025;3. 华东师范大学数据科学与工程学院,上海 200062)摘 要 教育数字化转型是一场深刻的自我革命,本质上是从以教师教学管理为中心的信息化转变为以学习者体验为中心的数字化,是从关注技术本身到关注数据价值的思维转变。本文通过对国内外主流数字教育平台的功能进行对比分析,揭示了当前平台在技术、应用和理念方面的局限性。在此基础上对当前在线教育进
2025-11-27 14:44:03
252
转载 首发!关于数据要素学科建设的深度思考
周傲英(华东师范大学数据科学与工程学院,上海 200062)摘 要 数据作为第五生产要素是重大的理论突破。数据生产要素与土地、资本等传统生产要素相比,数据具有非稀缺性,数据越用越多、越用越有价值。当前的人工智能是数据智能,是联结主义的胜利,本质上是数据驱动的智能的自动化。数据智能热意味着整体论作为科学研究方法论的复兴,新的科学发现将不仅仅局限于还原论范式。数据是互联网的底层逻辑,党管互联网落实在操作层面就是党管数据。国家数据局成立两年来,在数据基础制度和数据基础设施等方面开展了全面的探索,迫切需要学术界和科
2025-11-24 11:13:48
65
转载 编委风采 | 祝贺《大数据》编委吴枫当选中国工程院院士
新当选的中国工程院院士中,机械与运载工程学部11人,信息与电子工程学部9人,化工、冶金与材料工程学部10人,能源与矿业工程学部12人,土木、水利与建筑工程学部7人,环境与轻纺工程学部6人,农业学部8人,医药卫生学部8人。新当选的中国科学院院士中,数学物理学部14人,化学部11人,生命科学和医学学部13人,地学部9人,信息技术科学部11人,技术科学部15人。本次增选后,中国科学院共有院士908位。中国科学院、中国工程院21日公布2025年院士增选结果,分别选举产生中国科学院院士73人,中国工程院院士71人。
2025-11-21 10:57:49
61
转载 基于对比学习的数学应用题求解方法研究
通过分类器来监督生成的表达式与问题文本之间的一致性,确保模型生成的表达式更加精准。此外,本文引入对比学习方法,通过对比损失函数优化编码器的问题表示,即在最大化原型方程相同MWP表示间相似度的同时,最小化不同类型MWP表示间的相似度,增强编码器对原型方程相同MWP表示间相似性和不同类型AWP表示间差异性的感知能力,从而提高模型对多种类型MWP的求解效果。此外,当前的求解模型还会忽略自然语言中蕴含的深层数学逻辑,无法处理题目描述相似的MWP之间的细微差别,从而无法推导出正确的求解表达式,影响求解的准确性。
2025-11-20 16:16:48
78
转载 杉杉:面向高吞吐低延迟服务的计算机公共课问答系统
杨贇 刘天扬 王硕 苏斌 蒲鹏 陆雪松(华东师范大学数据科学与工程学院,上海 200062)摘 要 基于大语言模型的自然语言处理能力在智能问答场景展现出了广泛的应用潜力。为了给高校学生提供个性化的计算机学习支持,构建了一种基于代码大语言模型的计算机公共课问答系统“杉杉”。该系统采用前后端分离的结构设计,通过消息队列向大语言模型发送用户指令并监听模型返回结果;利用大语言模型的语言理解和生成能力,自动解答学生提出的计算机相关问题,并采用连续批处理和检索增强生成技术进行优化。性能评估实验表明,该系统在并发性能、响
2025-11-17 16:16:20
117
转载 基于重排序和后检索反思的教育大模型问答增强方法
在此基础上,提出基于重排序和后检索反思的教育大模型问答增强方法。本文提出的基于重排序和后检索反思的教育大模型问答增强方法在CS-Bench数据集的实验中取得了良好的结果,在使用多个不同生成模型时均使大模型回答正确率提升了5%左右,缓解了“幻觉”问题,并使大模型在计算机问答中更准确。其原因为外置知识库补充了大模型的知识细节,重排序对知识库信息进行了精细过滤,减少了无关材料对模型生成的干扰,后检索反思根据知识库提供的辅助材料,修正了生成过程中出现的部分“幻觉”,从而提升了大模型回答的准确性。
2025-11-13 16:38:54
41
转载 建设数据市场监管体系,推进数据统一大市场繁荣发展
叶雅珍,女,博士,复旦大学计算与智能创新学院教师,上海市数据科学重点实验室数据资产研究室主任,复旦大学数据产业研究中心主任助理,上海数据研究院特聘研究员,浙江省数据知识产权研究基地智库专家。数据产品生产再生产时,除了需要数据要素来源合法合规外,还需要生产制造商在生产数据产品时严格遵守国家的各类法律法规和标准要求,具备数据合规、质量控制、数据安全等技术能力,取得相应的数据产品生产资质,特别是一些涉及国家安全、市场秩序、个人隐私等特定行业领域的数据,更需要专门获得相关部门的数据生产制造授权许可。
2025-11-10 16:16:41
61
转载 基于数据知识产权体系的数据要素流通交易模式研究与实践
同时,本文对数据知识产权登记和数据要素流通交易的现状进行了分析和阐述,数据经济的全面健康发展需要依托于数据知识产权的确权和交易,但当前阶段仍存在平台分散、客体不统一、数据要素跨地域流通困难等问题,亟须整合现有分散的登记交易系统,构建全国统一的数据知识产权登记交易平台,制定统一的登记标准,提供从数据评估、登记、交易到结算的全链条服务,破除阻碍数据要素流通的确权难、交易难、互信难、监管难等问题,提高数据交易的效率和安全性。数据产品阶段,基于数据集合的加工使用权,数据处理者对数据产品享有独立的所有权。
2025-11-03 16:16:57
81
转载 数据知识产权改革实践——以浙江省为例
黄灿1,2 范理3 樊梅妍1,2(1. 浙江大学管理学院知识产权管理研究所,浙江 杭州 310058;2. 浙江省数据知识产权研究基地,浙江 杭州 310058;3. 浙江省知识产权研究与服务中心,浙江 杭州 311121)摘 要 为加快推进数据知识产权制度建设,对相关理论研究进行了回顾、评析,并以浙江省为例对数据知识产权改革经验进行提炼。理论层面上,学术界对数据的概念、数据权确认及其分配与解置形式进行了深入探讨,并强调了当前数据知识产权登记制度应当关注的问题。实践层面上,作为国家首批数据知识产权试点地方,
2025-10-31 16:17:07
53
转载 【专题征文】《大数据》专题“全国一体化数据市场”征文(截稿时间:2026年1月31日)
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。3、投稿时,请注明作者联系方式(电子邮件、电话、邮寄地址)及“‘
2025-10-30 16:16:26
42
转载 数据知识产权登记制度的形成逻辑、实践问题与改进路径研究
数据被视为“信息时石油”。2022年12月19日,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)提到,要“建立保障权益、合规使用”的数据产权制度,将数据产权“三权分置”,划分为数据资源持有权、数据加工使用权、数据产品经营权。认为,可以借鉴自物权-他物权和著作权-邻接权的权利分割模式,在数据权利体系设计上,根据不同主体对数据形成的贡献来源和程度的不同,设定数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构,以实现用户与企业之间数据财产权益的均衡配置。
2025-10-27 16:16:36
81
转载 数据知识产权保护的规则设计
范理(浙江省知识产权研究与服务中心,浙江 杭州 311100)摘 要 通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格性,厘清数据知识产权与数据产权、数据产品、数据知识产权构建方案等概念的区别。分析了数据知识产权与数据“三权分置”的关系,从鼓励数据流转使用角度分析数据知识产权制度的适用性,梳理数据知识产权持有者的权益。结合知识产权制度发展和案例,提出对“依法依规获取、经过一定规则处理、具有实用价值、智力成果属性、数据集合”要件的理解,数据知识产权登记的指导原则、登记审查
2025-10-20 16:16:30
99
转载 数据生产的创造性劳动的几种可能类型
叶雅珍1,2 朱扬勇1,2,3(1. 复旦大学计算与智能创新学院,上海 200438;2. 上海市数据科学重点实验室,上海 200438;3. 上海数据研究院,上海 200011)摘 要 近年来,数据知识产权实践快速发展,但在理论界还存在较多争论,其中之一便是数据生产过程中是否包含创造性劳动,这是判断一个数据集能否被赋予知识产权的关键因素之一。针对原始数据生产和数据再生产两个方面,分析讨论了其中包含的可能的创造性劳动,分别提出了原始数据生产和数据再生产的4种可能的创造性劳动,为当前数据知识产权登记过程中实质
2025-10-16 16:16:42
87
转载 《大数据》2025年第5期目次&摘要
点击上方蓝字关注我们《大数据》第11卷第5期 2025年9月大数据2025年第5期(点击原文链接在官网阅读完整文章)目次01 《大数据》十周年寄语马礼,王晓光02 基于重排序和后检索反思的教育大模型问答增强方法孙浩然, 王志豪, 吴一帆, 高晓影, 向阳03 杉杉:面向高吞吐低延迟服务的计算机公共课问答系统杨贇, 刘天扬, 王硕, 苏斌, 蒲鹏, 陆雪松04 基于对比学习的数学应用题求解方法研究张天成, 王玉杨, 张亦嘉, 于明鹤, 冷芳玲, 于戈05 基于知识增强大语言模型的历史学科试题生成系统纪天昀,
2025-10-13 16:17:10
77
转载 数据知识产权: 将知识产权扩展到网络空间
叶雅珍1,2 朱扬勇1,2,3(1. 复旦大学计算与智能创新学院,上海 200438;2. 上海市数据科学重点实验室,上海 200438;3. 上海数据研究院,上海 200011)摘 要 数据知识产权作为数据产权制度的重要内容而广受关注。虽然数据知识产权实践如火如荼,但是否需要设立数据知识产权、如何设立数据知识产权在学术界尚存争议。分析讨论了数据形式的知识产权的存在性,给出了可赋数据知识产权的3种数据集类型,从新的保护客体、新的甄别方法、新的保护手段三方面论述了新设数据知识产权的必要性,提出了一个数据知识产
2025-10-10 16:16:36
122
转载 基于One-Class学习的鲁棒音频真伪识别
梁子琪1,2 张旭龙1 王健宗1 肖京1(1. 平安科技(深圳)有限公司,广东 深圳 518063;2. 中国科学技术大学先进技术研究院,安徽 合肥 230026)摘 要 深度伪造技术对社会经济、政治稳定和社会安全构成了严重威胁,而深度伪造中,语音伪造技术被广泛应用于电话诈骗、舆论操控等危害性活动中。近年来,随着深度学习技术的应用,语音合成和语音转换技术飞速进步,已经能够生成以假乱真的语音,足以欺骗机器和人类。针对语音伪造技术的危害,目前已经有许多语音欺骗检测技术来提高说话人验证系统的可靠性。然而,现有方法
2025-09-29 16:20:37
155
转载 基于5W传播模型的技术体系:计算传播技术综述
王续澎 何洪波 王闰强(中国科学院计算机网络信息中心,北京 100083)摘 要 海量的数据和人工智能技术为传播学的研究提供了很大的便利,可以有效地解决传播效果测量的问题。该领域现有的研究主要关注计算传播学的研究范式、场景应用和发展路径,缺少对计算传播中新型计算方法的梳理和归纳。采取文献调研法,提出了基于5W传播模型的计算方法归类框架,以提升传播效果为目标,较系统地梳理了传播过程中的新型计算方法,阐述了不同计算方法的思路、所需的数据集以及各项评价方法。分析了计算传播技术面临的挑战,展望了未来可能的研究方向。
2025-09-25 16:16:37
188
转载 基于多模态大模型的具身智能体研究进展与展望
赵博涛 亢祖衡 瞿晓阳 彭俊清 张旭龙 王健宗(平安科技(深圳)有限公司,广东 深圳 518063)摘 要 具身智能体指能够根据指令完成某种或多种任务并且具备与物理环境交互能力的智能实体。其在服务机器人、智能教育、辅助医疗等领域具有巨大的潜在应用,是实现通用机器人的重要途径之一。随着多模态大模型的发展,具身智能体具备了更强的语言理解、推理判断和环境感知能力,极大地推动了该领域的发展。近年来,具身智能体领域涌现出许多优秀的研究工作,但缺乏系统的调查评述。为了帮助研究者更全面地了解这一领域,对具身智能体的研究进
2025-09-22 16:16:49
370
转载 山东省推行“无证明之省”赋能数字政府建设研究
侯新玥(山东省大数据中心,山东 济南 250011)摘 要 各地区和政府部门正积极探索数字政府建设的新模式,推进电子证照扩大应用领域和全国互通互认。山东省聚焦深化“放管服”改革,优化营商环境,将建设“无证明之省”作为推动政府数字化转型的重要举措。然而,目前山东省正处在“无证明之省”建设的初期,在探索“无证明”服务过程中还面临一些问题和挑战。为此,分析其中的难点、痛点及堵点,并提出具有针对性的对策建议,旨在加快山东数字政府建设的进程,进一步提升政务服务效能。关键词 无证明之省; 电子证照证明; 数字政府DOI
2025-09-15 16:16:39
95
转载 2025第三届全国工业互联网创新大赛颁奖典礼在宁隆重举行
8月21日上午,由国家自然科学基金委员会信息科学部、江苏省工业和信息化厅指导,未来工业互联网基础理论与关键技术重大研究计划指导专家组主办,中国工业互联网研究院、南京航空航天大学、南京邮电大学、紫金山实验室、南京工业职业技术大学承办,国家自然科学基金委员会科学传播与成果转化中心、江苏省工业互联网发展研究中心、北京海外高层次人才协会协办的“2025第三届全国工业互联网创新大赛颁奖典礼”在南京隆重举行。本届大赛的成功举办,呈现了新工业控制、新工业网络、新工业智能、新工业安全的工业互联网新的发展态势。
2025-08-25 13:23:58
177
转载 【CCF BigData 2025开放注册,早鸟截止8月17日】
CCF大数据学术会议由中国计算机学会(CCF)主办,是我国大数据领域最具影响力、规模最大的高水平学术会议之一,自创办以来已成功举办12届。大会将持续发挥国家级智库作用,汇聚国内外顶尖专家学者与产业力量,助力国家大数据战略实施与数字中国建设。”这一主题指引下,本次大会将聚焦大数据在新技术背景下的创新发展路径,深入探讨数据资源的高效治理、价值释放与安全应用,推动大数据与人工智能技术的协同创新。重磅回归,同时设立多个特色技术论坛,汇聚领域权威专家,深入剖析大数据关键技术突破与前沿发展趋势。
2025-08-05 09:48:00
171
转载 面向云边端协同的数据库预聚合方法研究
崔双双 马若尧 王宏志 (哈尔滨工业大学计算学部,黑龙江 哈尔滨 150001)摘 要 云边端协同架构是智能制造、智慧城市等应用的基础,协同计算是其重要支撑技术。在云边端协同架构下,由于数据类型多样且规模庞大,传统数据管理技术难以支持大规模数据的实时查询。为此,提出一种面向云边端协同的数据库预聚合方法,通过物化视图自动生成策略实现数据预聚合,提升实时查询性能。实验结果表明,该预聚合方法使查询时间最多缩短68.45%,显著提升了云边端协同架构下的数据查询性能。关键词 云边端协同; 物化视图;深度强化学习DO
2025-08-05 09:48:00
160
转载 “地方政府大数据”栏目 视频解读 | 山东省实践
大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。关注《大数据》期刊微信公众号,获取更多内容。
2025-07-18 17:44:48
71
转载 大会日程确认,CCF第40届中国计算机应用大会将在京召开
大会期间还将举办中国计算机应用技术大赛——全国总决赛,“全国智能无人车大赛”、“全国算法精英大赛”、“全国测试开发大赛”等多条赛道将汇聚超过3000人同场竞技,以赛促学,产教融合,协力助推计算机应用赋能新质生产力。围绕可信医学人工智能、智慧气象、可信数据空间、信息系统应用与安全评测、智慧海洋、工业人工智能、AI大模型、期刊编辑面对面、青年学者国际影响力、技术公益等。由中国计算机学会(CCF)主办,CCF计算机应用专业委员会、北京邮电大学、上海师范大学联合承办的。:2025年8月6-9日(不含报道日)
2025-07-17 15:16:49
146
转载 《大数据》2025年第4期目次&摘要
通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格性,厘清数据知识产权与数据产权、数据产品、数据知识产权构建方案等概念的区别。分析讨论了数据形式的知识产权的存在性,给出了可赋数据知识产权的3种数据集类型,从新的保护客体、新的甄别方法、新的保护手段三方面论述了新设数据知识产权的必要性,提出了一个数据知识产权的定义,以及知识产权从物理空间向网络空间扩展形成数据知识产权的框架,为数据知识产权推进提供了理论支持。罗中岩, 夏正勋, 唐剑飞, 杨一帆, 杨洪山, 李昊骅, 张燕。
2025-07-15 16:30:14
108
转载 SpanTrain:基于云边端异构设备的跨域分布式模型训练系统
王锦权1,2刘旭昭1,2廖晓坚1,2肖利民1,2霍志胜1,2索珈顺1,2李云潼1,2沈润楠1,2,3谢喜龙1,2唐熙程1,2(1.北京航空航天大学计算机学院,北京 100191;2.北京航空航天大学复杂关键软件环境全国重点实验室,北京 100191;3.北京航空航天大学沈元学院,北京 100191)摘 要 目前,除云计算中心外,以物联网、固定或移动计算边缘为代表的边、端侧环境中也部署了大量的智能计算设备。将深度神经网络(DNN)模型的训练任务从云计算中心拓展到边、端侧,在新应用模式支持、数据隐私保护、训练成
2025-07-09 17:04:28
270
转载 面向广域分布式智能计算的运行时算力网络资源协同调度方法研究
本文提出的RCSR方法通过综合考虑资源负载情况、数据访问热度等多重因素,协同调整系统中的任务分配、网络资源分配和数据布局,使系统中的任务执行更加高效,因此RCSR方法相较于对比基准算法具有更优的系统吞吐量性能。可见,在系统负载较小时,即任务数量较少时,数据副本机制带来的额外开销将造成较大的性能损失,此时DRS方法和RCSR方法的全局数据迁移开销达到runData方法的近3倍。然而,随着系统负载的增加,数据副本机制的优势将会更加明显,RCSR方法在全局数据迁移开销性能上与runData方法的差距逐渐缩小。
2025-07-03 17:03:54
222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅