《大数据》2020年第5期目次&摘要

点击上方蓝字关注我们

《大数据》

第6卷第5期 2020年9月

大数据2020年第5期

(点击原文链接在官网阅读完整文章)

目次

01 专题导读:医学大数据

邹北骥

02 一种基于深度神经网络的临床记录 ICD自动编码方法

杜逸超,徐 童,马建辉,陈恩红,郑 毅,刘同柱,童贵显

03 基因组大数据变异检测算法的并行优化

崔英博,黄 春,唐 滔,杨灿群,廖湘科,彭绍亮

04 医疗大数据在学习型健康医疗系统中的应用 

柴扬帆,孔桂兰,张路霞

05 基于生成对抗网络的医学数据域适应研究

于胡飞,温景熙,辛 江,唐 艳

06 制造业生产过程中多源异构数据处理方法综述

陈世超,崔春雨,张 华,马 戈,朱凤华,商秀芹,熊 刚

07 基于分层注意力网络的方面情感分析

宋 婷,陈战伟,杨海峰

08 基于区块链的链上数据安全共享体系研究

刘彦松,夏 琦,李 柱,夏 虎,张小松,高建彬

09 链上存证、链下传输的可信数据共享平台 

张 召,田继鑫,金澈清

10 银行业金融机构数据治理指引和 DCMM的对比分析

代 红,张 群,芦皓麟,宾军志

11 Paper Pal:一个中英文论文及其代码大数据搜索平台

余 万,付聿炜,熊 贇,朱扬勇

摘要

专题:医学大数据

导读

作者:邹北骥

摘要:医学是人类重点关注的领域之一。医学水平与人类健康息息相关,医学的进步是人类健康生活的重要保障。医学领域包括医疗、生物、药物等多个方面,每天产生的数据在EB级以上,医学数据是典型的大数据。采集、分析并挖掘医学大数据中的高价值信息对于利用信息技术开展医学研究、提升临床医疗诊断水平、发现新药物、开展基因分析与各类生物实验等具有重要的意义。《大数据》期刊专门策划了“医学大数据”专题,旨在阐述医学大数据领域的科学问题、研究方法,展示医学大数据领域的最新研究成果,开拓学者的研究视野。本期“医学大数据”专题共收集4篇学术论文。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00001.shtml

一种基于深度神经网络的临床记录 ICD自动编码方法

作者:杜逸超,徐 童,马建辉,陈恩红,郑 毅,刘同柱,童贵显

摘要:随着国际疾病分类(international classification of diseases,ICD)编码数量的增加,基于临床记录的人工编码难度和成本大大提高,自动ICD编码技术引起了广泛的关注。提出一种基于多尺度残差图卷积网络的自动ICD编码技术,该技术采用多尺度残差网络来捕获临床文本的不同长度的文本模式,并基于图卷积神经网络抽取标签之间的层次关系,以加强自动编码能力。在真实医疗数据集MIMIC-III上的实验结果表明,该方法的P@k和Micro-F1分别为72.2%和53.9%,显著提高了预测性能。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00003.shtml

基因组大数据变异检测算法的并行优化

作者:崔英博,黄 春,唐 滔,杨灿群,廖湘科,彭绍亮

摘要:序列比对和变异检测是基因组数据分析的基础步骤,是后续各种功能性分析的前提,也是基因组数据分析中最耗时的环节。为有效处理高通量测序技术产生的海量基因组大数据,采用OpenMP、MPI等技术,对序列比对算法和SNP检测算法进行了多级并行优化,并对相关算法进行了改进。在不同数据集和并行规模下的测试中,核心算法加速比达到9倍以上,大规模测试中算法的并行效率保持在60%以上,在保证精度的前提下获得了良好的并行性能和可扩展性,有效提高了基因组大数据变异检测的能力。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00016.shtml

医疗大数据在学习型健康医疗系统中的应用 

作者:柴扬帆,孔桂兰,张路霞

摘要:将医疗大数据应用于旨在加快知识生成和临床转化应用的学习型健康医疗系统(LHS)中,满足患者和医疗决策者的知识需求,有助于推动精准医学的发展。在系统阐述医疗大数据与LHS发展现状的基础上,结合LHS的典型应用案例,重点分析医疗大数据在LHS中的应用特点及面临的挑战。最后总结了我国发展LHS面临的挑战,并对未来进行了展望。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00029.shtml

基于生成对抗网络的医学数据域适应研究

作者:于胡飞,温景熙,辛 江,唐 艳

摘要:在医疗影像辅助诊断研究中,研究者通常使用不同医院(多域)的数据,但当其中一个域的训练样本较少时,模型在该域的测试集上的分类结果将会很差。针对此问题,提出一种基于生成对抗网络的分类方法进行男女脑影像差异的域适应研究,首先使用生成对抗网络学习不同域的数据分布,并提取关键特征,然后基于提取的关键特征研究不同域的男女脑影像差异。实验表明,该方法在仅有少量数据参与训练的域上也能取得80%以上的分类准确度。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00045.shtml

研究

制造业生产过程中多源异构数据处理方法综述

作者:陈世超,崔春雨,张 华,马 戈,朱凤华,商秀芹,熊 刚

摘要:随着现代制造业向着自动化、信息化、智能化方向快速发展,生产过程中会产生大量的多源异构数据。对多源异构数据的有效处理和深度挖掘可为生产制造者提供更有效的生产调度、设备管理等策略,从而提高生产质量和效率。针对制造业生产过程中多源异构数据的处理方法与技术等进行系统性的综述,首先明确了制造业生产过程多源异构数据内容及分类;其次,阐述了多源异构数据处理中数据采集、数据集成及数据分析各个阶段应用的数据处理方法和技术,并分析了各种方法与技术的优缺点以及应用;最后,对生产过程中多源异构数据处理方法和技术进行总结,指出了现阶段多源异构数据处理方法及技术面临的挑战和发展趋势。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00055.shtml

基于分层注意力网络的方面情感分析

作者:宋 婷,陈战伟,杨海峰

摘要:基于深度学习的方面情感分析是自然语言处理的热点之一。针对方面情感,提出基于方面情感分析的深度分层注意力网络模型。该模型通过区域卷积神经网络保留文本局部特征和不同句子时序关系,利用改进的分层长短期记忆网络(LSTM)获取句子内部和句子间的情感特征。其中,针对LSTM添加了特定方面信息,并设计了一个动态控制链,改进了传统的LSTM。在SemEval 2014的两个数据集和Twitter数据集上进行对比实验得出,相比传统模型,提出的模型的情感分类准确率提高了3%左右。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00082.shtml

基于区块链的链上数据安全共享体系研究

作者:刘彦松,夏 琦,李 柱,夏 虎,张小松,高建彬

摘要:针对人们在日益增长的数字化交互过程中越来越多地出现隐私直接或间接泄露的问题,主要研究基于区块链网络建立一套链上数据安全共享体系,基于密文策略的属性加密的访问控制算法以及同态加密算法实现链上数据的可靠共享,提出了一种链上数据共享架构,最后进行了仿真实验,并分析了实验结果。这项工作有效解决了恶意参与方利用区块链的交易透明性进行数据分析的问题,并保证了用户数据在共享流程中的隐私安全。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00092.shtml

应用

链上存证、链下传输的可信数据共享平台 

作者:张 召,田继鑫,金澈清

摘要:区块链系统可以为分享数据的互不信任的多方之间提供可信的基础设施。但是,将原始分享数据直接上链的方式并不适合大规模的数据分享场景。因此,提出了一种数据共享请求和应答记录上链存证、原始数据链下安全传输的数据共享平台架构,该架构在一定程度上可以缓解系统负载过重以及隐私保护方面的问题。最后总结了随着参与节点的增多,以及每秒需要处理的数据共享请求和应答的增多,已有的区块链技术被应用到数据分享和确权领域时,在分布式存储、共识协议、智能合约执行以及轻客户端查询方面面临的挑战以及改进的方向,以期为已有区块链系统应用于数据共享领域指明需要进一步突破的技术瓶颈。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00106.shtml

论坛

银行业金融机构数据治理指引和 DCMM的对比分析

作者:代 红,张 群,芦皓麟,宾军志

摘要:近年来,数据治理得到各行各业的普遍重视,国家和行业都发布了相关的标准和政策,通过相关文件明确数据治理的概念和体系,促进数据治理行业的发展。对相关文件进行解读,总结其中的异同之处,帮助人们了解与数据治理相关的管理趋势和应用的重点,同时,提出数据管理能力成熟度评估模型在银行业落地实施的建议,帮助银行更好地满足相关监管要求,提升数据管理能力的成熟度等级。

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00118.shtml

动态

Paper Pal:一个中英文论文及其代码大数据搜索平台

作者:余 万,付聿炜,熊 贇,朱扬勇

原文链接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-5-00129.shtml

联系我们:

Tel:010-81055448

       010-81055490

       010-81055534

E-mail:bdr@bjxintong.com.cn 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中文科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号,获取更多内容

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值