《大数据》2022年第3期目次&摘要

fd95821110a23d53b08915d6b272e490.png

点击上方蓝字关注我们

ee01030300bef3667a29faf484dddc2e.png

5945fa0e15218c2682c04fbca06e518a.png

《大数据》

第8卷第3期 2022年5月

大数据2022年第3期

(点击原文链接在官网阅读完整文章)

目次

01 专题:数据要素市场建设

朱扬勇, 潘柱廷

02 ‍数据流通市场中数据产品的特性及其交易模式

黄丽华, 窦一凡, 郭梦珂, 汤奇峰, 李根

03 盒装数据:一种基于数据盒的数据产品形态

叶雅珍, 朱扬勇

04 从数据质量到数据产品质量

蔡莉, 朱扬勇

05 数据交易中的权利确认和授予体系

汤奇峰, 邵志清, 叶雅珍

06 基于多方计算技术的数据交易机制研究

刘小霞, 张嘉熙, 王申, 杨祖艳

07 数据交易相关法规比较研究

文英姿, 曲杨, 张旭东, 徐珺, 李建平

08 数据相关国际税制评述

谢波峰

09 区块链在个性化推荐系统中的应用研究综述

许小颖, 陈熙, 陈源, 谢永靖

10 融合一致性正则与流形正则的半监督深度学习算法

王杰, 张松岩, 梁吉业

11 结合语言知识和深度学习的中文文本情感分析方法

徐康庭, 宋威

12 基于NLP的中医医案文本快速结构化方法

肖晓霞, 刘明婷, 杨冯天赐, 刘鉴建县, 杨阳, 石月

13 元宇宙数字经济:现状、特征与发展建议

王陈慧子, 蔡玮

14 中国大数据产业产值测算方法研究

  • 杨玫, 李玮, 乔思渊, 刘巍

15 漫威电影中的深度学习

  • 王元卓, 江旭晖, 陆源

摘要

专题:数据要素市场建设

专题导读:数据要素市场建设

作者:朱扬勇, 潘柱廷

摘要:随着国家大数据战略的实施,“数据是数字经济的关键要素”已经形成共识。2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将数据作为与土地、劳动力、资本、技术等传统要素并列的第五大生产要素,指出要加快数据要素市场的培育;2022年1月,国务院发布《“十四五”数字经济发展规划》,指出到2025年数据要素市场体系初步建立。这是数字经济领域的重大创新举措,必将推动我国数字经济持续健康快速发展。

什么样的数据可以流通?数据如何流通?数据交易市场如何运行?数据市场的法规建设和财税体系建设如何推进?这些都是数据要素市场建设需要考虑的问题。为了探索解决这些问题的路径,我们策划组织了“数据要素市场建设”专题,经过专家评审,最终录用7篇论文,论文内容涵盖了可交易数据产品、数据交易模式、数据交易技术、数据交易相关法规和财税体系等数据要素市场建设的主要方面。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00001.shtml

数据流通市场中数据产品的特性及其交易模式

作者:黄丽华, 窦一凡, 郭梦珂, 汤奇峰, 李根

摘要:数据的流通交易是数据要素市场化配置的关键环节。我国前期的数据市场探索过程中暴露出一系列问题,迫切需要从理论角度对数据市场基本逻辑进行重新梳理。从交易成本理论、电子市场框架和电子交易模式等不同视角分析了数据产品流通过程,并提出数据的可计算性给数据交易带来了两类影响:一方面,可计算性使得数据能够被不断分析从而更加符合垂直领域的需求;另一方面,可计算性也会推动数据交易过程离开市场,呈现去平台化的趋势。基于电子市场经典理论框架将数字产品分为4个象限并进行相应分析,提出了对数据供方和数据市场管理者的建议。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00003.shtml

盒装数据:一种基于数据盒的数据产品形态

作者:叶雅珍, 朱扬勇

摘要:与通常的商品市场一样,数据市场中流通的数据商品也分为标准产品和非标准产品两大类。目前,市场中有效流通的数据产品是音乐、图片、电影等标准数据产品,而一般意义上的、大规模的大数据流通则遇到了诸多障碍,其中一个障碍就是数据产品的计量计价问题,需要设计一个可计量的标准数据产品形态。基于数据盒模型,设计了一种数据产品的基础标准形态,称之为盒装数据。一个盒装数据产品包括盒内数据、盒外包装两部分,其中,盒内数据是指“时间+空间+内容”三维度的数据立方体组织,一般包括图像、图形、视频、音频、文本、结构化数据等多种数据类型;盒外包装包括产品登记证书,以及产品说明书、质量证书、合规证书等内容。盒装数据旨在为数据要素市场提供一个可计量计价的标准数据产品形态。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00015.shtml

从数据质量到数据产品质量

作者:蔡莉, 朱扬勇

摘要:长期以来,数据质量研究主要是为了满足组织自身信息系统正常运行的需求。随着数据要素市场的建设与发展,数据的质量需求从“自用需求”转变为“他用需求”“监管需求”。数据市场中的数据产品质量问题是数据使用者(购买者)和市场监管机构重点关注的内容。分析了数据产品质量的使用者需求和监管者需求,创新性地提出了一个数据产品质量体系框架;在此基础上,以盒装数据产品为例,从时间、空间和内容完整性3个方面构建了对应的质量维度、质量指标和质量评测模型。该质量体系可以对资源类数据产品进行检测和评定,能够为数据产品购买者和市场监管机构提供行之有效的检测依据和标准。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00026.shtml

数据交易中的权利确认和授予体系

作者:汤奇峰, 邵志清, 叶雅珍

摘要:数据是数字经济的关键生产要素,建立数据要素市场势在必行。数据要素市场建设包括数据确权、交易标的、定价机制、交易平台和交易监管等多个方面的建设。对数据产品/服务在数据交易所进行交易时所需要的权利及其确权行为、确权机构等进行了系统性探索,将数据交易标的形态设计为“数据产品/服务+某种权利”,设计了针对数据产品形态和数据服务形态的各种授权,同时形成了数据交易的授权体系。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00040.shtml

基于多方计算技术的数据交易机制研究

作者:刘小霞, 张嘉熙, 王申, 杨祖艳

摘要:近年来,数据要素交易与数据要素市场建设受到社会各界的高度关注。区别于传统生产要素,数据要素存在“准公共品”性、信息不对称性与负外部性等经济特征,这些特征是当前阶段阻碍其大规模流通的主要因素。结合数据要素的经济特征,从技术视角切入,探索基于多方计算的数据交易机制在现有政策与市场环境下的实践应用,通过“数据可用不可见、数据使用可控可计量”的交易机制,为现阶段数据要素大规模流通提供一种解决思路。同时,深入分析北京国际大数据交易所已上线的数据安全融合产品,为基于多方计算的数据大规模流通工程化落地与数据要素市场建设提供借鉴。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00054.shtml

数据交易相关法规比较研究

作者:文英姿, 曲杨, 张旭东, 徐珺, 李建平

摘要:随着国家将数据确定为生产要素,各地加快了与数据交易相关的立法,探索构建数据要素市场,推动数字经济发展。对比分析了数据交易相关法规,认为各地在交易原则、禁止交易数据、数据安全等方面基本形成共识,条文相对清晰且具有一定的可操作性;而交易标的、数据权属等方面的规定仍不够清晰且难以落地,同时还存在数据安全监管难度大、数据交易生态不完善等问题。最后,对未来制定数据交易法规、建设数据交易市场提出了建议。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00066.shtml

数据相关国际税制评述

作者:谢波峰

摘要:数据要素作为一种新的生产要素,与之对应的数据税目前并不存在,但存在与其相关的税制。分析了数字服务税、数字资产税以及无形资产税等相关税种与数据税之间的理论联系,阐述了各国在这些税制中的实践情况,从征税范围等税制要素中可以看出相关税种与数据税之间的紧密联系,并展开了相应的评述和分析。基于上述国际实践,认为现有相关税制对于数据税具有重要借鉴意义,数据税的设计应该激励与规范并重、政策与征管联动。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00078.shtml

研究

区块链在个性化推荐系统中的应用研究综述

作者:许小颖, 陈熙, 陈源, 谢永靖

摘要:区块链作为一种新兴技术,以其去中心化、难以篡改、匿名性和可追溯性等特点,为个性化推荐系统的改进提供了一种崭新的思路。为此,首先对近年来推荐系统面临的主要问题和区块链技术带来的机遇进行归纳总结,然后采用文献分析方法,从时间分布、文献类型、研究问题和评估指标4个层面,对推荐系统中区块链技术的应用研究进行分析和总结。分析结果表明:区块链对于解决推荐系统的数据安全和隐私保护、数据共享、数据可信和推荐透明度问题有重要意义;已有研究主要集中于解决推荐系统中用户的数据安全和隐私保护问题,而在跨平台数据共享、数据激励机制设计和系统可扩展性等方面的研究仍有待进一步突破。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00087.shtml

融合一致性正则与流形正则的半监督深度学习算法

作者:王杰, 张松岩, 梁吉业

摘要:半监督学习已被广泛应用于大数据分析。目前,基于一致性正则的方法是半监督深度学习的研究热点之一。然而这类方法没有考虑数据的流形结构,可能会导致部分相近的样本得到差异很大的输出,进而导致分类器性能下降。针对这个问题,提出了一种融合一致性正则与流形正则的半监督深度学习算法。该算法在对模型施加一致性约束的同时,对样本构图并加入平滑性损失,实现了每个样本点局部邻域的平滑以及邻近(相连)样本点之间的平滑,从而提高半监督深度学习算法的泛化性能。在多个图像和文本数据集上的实验结果表明,与其他的半监督深度学习算法相比,所提算法更有效。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00103.shtml

结合语言知识和深度学习的中文文本情感分析方法

作者:徐康庭, 宋威

摘要:在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值;而基于深度学习的方法由于未能运用语义规则和情感词典等语言知识,不能充分提取情感特征。针对这两种方法的缺点,提出了一种将语言知识和深度学习结合的文本情感分析方法。该方法首先根据语义规则提取文本中的关键情感片段,再根据情感词典从关键情感片段中抽取出情感更加明确的情感词来构建情感集合,然后利用深度学习模型分别从原始文本、关键情感片段、情感集合中抽取深层次特征,最后对提取的特征进行加权融合,并利用分类器实现情感极性的判断。实验结果表明,与未引入语言知识的深度学习模型相比,该方法的情感极性分类能力有明显提升。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00115.shtml

基于NLP的中医医案文本快速结构化方法

作者:肖晓霞, 刘明婷, 杨冯天赐, 刘鉴建县, 杨阳, 石月

摘要:中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法。将《中国现代名中医医案精粹》作为结构化对象,采用光学字符识别技术识别医案截图的文本,同时对文本做初步结构化。构建简单症状词典,采用结合词典的改进的N-gram模型获取医案文本中的症状、体征等词,并在结构化过程中更新词典,实现了对4 754份文本医案的结构化。随机选取666份医案文本对最终模型进行测试,其F1值达到82.99%。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00128.shtml

论坛

元宇宙数字经济:现状、特征与发展建议

作者:王陈慧子, 蔡玮

摘要:随着美国科技公司Facebook更名为Meta,元宇宙成为2021年年底非常火爆的科技名词。首先通过梳理元宇宙技术概念的发展过程,阐述了该行业在这一历史阶段发展的必然性和必要性。在此基础上,通过对国外元宇宙数字经济发展现状的剖析,揭示了去中心化数字经济的风险与挑战。最后,指出去中心化的关键精神内核在于全球普适的反垄断思潮,并由此展望国内元宇宙产业的前景。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00140.shtml

中国大数据产业产值测算方法研究

作者:杨玫, 李玮, 乔思渊, 刘巍

摘要:大数据产业发展当前仍然面临产业边界不够清晰、企业界定不够明确、产值测算方法不够统一等产业发展问题和痛点,在遵循现阶段我国大数据产业发展客观实际的基础上,将大数据产业链划分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5个层级,并对大数据企业概念进行界定。通过获取相关层级各细分领域骨干企业市场营收占比、细分领域骨干企业大数据营收占主营业务收入比均值,折算细分领域大数据产业产值。最终运用加总法测算出2016—2021年我国大数据产业产值为44 908亿元,并预判“十四五”时期,我国大数据产业年均复合增长率约为25%,即到2025年我国大数据产业营收预计突破3万亿元。

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00151.shtml

学术科普

漫威电影中的深度学习

作者:王元卓, 江旭晖, 陆源

原文链接:http://www.infocomm-journal.com/bdr/article/2022/2096-0271/2096-0271-8-3-00161.shtml

联系我们:

Tel:010-81055448

       010-81055490

       010-81055534

E-mail:bdr@bjxintong.com.cn 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作:010-81055307

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

7ff4fcd7bd7bba5a9cdced01c43b5a0a.png

关注《大数据》期刊微信公众号,获取更多内容

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值