【行业新闻】
01 国家数据局:我国数字经济发展五个“新”
7月30日上午,国家数据局举行2024中国国际大数据产业博览会新闻发布会。国家数据局副局长沈竹林出席发布会并表示,可以从五个方面来概括数字经济发展的主要进展,也可以归纳为五个“新”:一是是数据基础制度建设迈上新台阶;二是数字基础设施建设实现新跨越;三是是数字产业化和产业数字化发展取得了新成效;四是是数字赋能公共服务收获新进展;五是数字经济治理实践迎来新变革。
02 新华社:警惕政务数据资产化诱发“数据财政”冲动
近期公布的《国务院关于2023年度中央预算执行和其他财政收支的审计工作报告》显示,4个部门所属7家运维单位未经审批自定数据内容、服务形式和收费标准,依托13个系统数据对外收费2.48亿元。事实上,一些地方政府试图利用政务数据获利,曾引发舆论质疑。比如,2023年11月,湖南省衡阳市曾在网上发布公告,竞拍政务数据资源和智慧城市特许经营权,起拍价18亿元,被舆论称为“政务数据第一拍”,但很快被相关部门叫停。有媒体曾评论说,这是全国首次公开交易公共数据特许经营权,此举象征着公共数据授权运营万亿市场即将打开,“数据财政”或就此拉开帷幕。
03 北数所推出人工智能大模型训练数据集产品,助力大模型训练精细化
近日,北京国际大数据交易所联合相关数据集提供方,推出人工智能大模型训练数据集产品,助力企业大模型训练,训练数据集覆盖科技创新、金融服务、医药研发、自动驾驶、气象服务、遥感影像、影视创作等众多应用场景,共计170余个数据集,内容涵盖了专业知识问答、中外论文期刊、古今文化书籍、互联网舆情资讯、知识产权与专利、多语种音视频、教学资源题库、科研数据、自动驾驶环境场景数据、高清图片等众多领域。
04 上海数据交易所与国际另类数据聚合平台达成战略合作,共建跨境数据流通交易生态
8月1日,上海数据交易所与欧洲领先的另类数据聚合平台企业Eagle Alpha正式签署战略合作协议。双方将建立海外平台数据双向流动合作机制,通过规则对接、供需对接、信息共享等一系列互联互通的举措帮助全球企业拓展数据跨境流通业务,提升企业在数据交付等方面的安全性和便捷性,促进全球数据流通交易。上海数据交易所
05 浙江大数据交易中心与嘉善县启动共建“嘉善数据专区”
8月8日上午,“智汇南湖 数据赋能”2024数据产业发展大会暨2024年“数据要素×”大赛浙江分赛嘉兴站颁奖仪式在嘉兴举行。会上,浙江大数据交易中心与嘉善县数据局、长三角(嘉善)大数据投资有限公司达成合作意向并签订三方战略合作协议,合力建设浙江大数据交易服务平台嘉善数据专区。
【政策速览】
01 深数所发布全国首个数据交易定价服务指南
近日,深圳数据交易所正式发布了《深圳数据交易所定价服务指南》(1.0 版本),这是全国首个针对数据产品、数据工具和数据服务的定价服务指南。指南提出了基本要求,包括术语和定义、定价原则、定价标的、定价流程、评价和改进内容等。它依据《深圳市数据交易管理暂行办法》等规范文件,明确了数据定价的范围、参与方、标的和方法。
02 北数所发布《个人信息授权运营管理办法(试行)》
近日,北京国际大数据交易所按照《中华人民共和国个人信息保护法》的框架,在北京市相关委办局的指导下,发布了《个人信息授权运营管理办法(试行)》,旨在规范个人信息授权运营管理,保障个人信息主体的知情权、决定权和收益权,同时促进个人信息的合规流通。
北数所自主研发运营的数据授权平台,正是本《办法》的具体实现。该平台致力于构建一个开放、共享、安全的个人信息授权和利用的生态系统。通过该平台,我们不仅能够保护个人信息的安全,还能促进数据资源的合理利用,推动数字经济的高速发展。鼓励合法持有个人信息或对个人信息有需求的企事业单位通过本《办法》接入北数所数据授权平台,共同推进个人信息保护和合规利用。
03 欧盟委员会发布《人工智能在处理和生成新数据方面的作用:开放数据环境中的法律政策挑战》报告
近期, 欧盟委员会发布《人工智能在处理和生成新数据方面的作用:开放数据环境中的法律政策挑战》报告,探讨了人工智能与开放数据的关系以及由此引发的知识产权和基本权利问题,同时讨论了欧盟《人工智能法案》在管理人工智能风险方面的相关内容和影响。报告主要包括三个方面。 一是开放数据在促进人工智能发展的同时也带来了一系列法律问题。二是《通用数据保护条例》等欧盟现行法律框架在应对人工智能挑战方面存在不足。三是欧盟《人工智能法案》有望在管理人工智能风险方面发挥重要作用,但实际效果仍有待观察。CAICT互联网法律研究中心
【专家观点】
01 Nature:AI训练数据之困:垃圾进,垃圾出
近日,发表在Nature杂志上的一项新研究表明,当人工智能模型使用人工智能生成的数据进行训练时,会遭遇模型输出质量下降的问题,这可能导致模型性能的进一步恶化和迭代速度的减缓。研究通过 “困惑度分数” 衡量了模型输出的荒谬程度,并发现在后续模型输出数据上进行训练会导致模型的准确度降低。为了解决这一问题,未来的人工智能模型可能需要依赖更多的合成数据,同时强调了高质量、多样化的训练数据的重要性,以及确保模型给予原始人类生成数据更多权重的必要性。然而,如何有效区分互联网上的人类生成数据与人工智能生成数据仍然是一个未解决的挑战。
02 公共数据、基础设施与人工智能:数据市场发展的三个驱动力
数据要素市场的发展受到三个主要驱动力的推动:公共数据的开放与共享、基础设施的建设与完善以及人工智能技术的进步与应用。不同国家根据自身特点和政策导向,形成了多样化的数据市场发展模式。例如,美国模式:推动政府数据开发利用,鼓励市场主体开展数据应用创新;欧盟模式:深化数据空间战略,加快布局一体化数据开发利用基础设施;日本模式:倡导可信数据自由流动,高度重视公共数据集建设;韩国模式:发挥人工智能等新兴技术作用,促进数据要素开发利用。
在全球范围内,数据要素市场的兴起不仅促进了数据的社会化大生产,还推动了经济向数据驱动转型。中国在这一领域,通过政府的顶层设计和市场主体的积极参与,加快了数据基础设施和管理体制的建设,推动了数据要素的高效流通和产业应用,同时也在探索数据价值化的制度安排,以实现数据资源的价值最大化。
03 毛基业:数据要素赋能产业链发展与治理
上海科技大学创业与管理学院学术院长、中国人民大学商学院原院长毛基业教授在2024中国数字经济发展和治理学术年会以《数据要素赋能产业链发展与治理》为题进行了主旨演讲。核心观点:
数据如果要产生价值,一定要关联。讲到大数据,大家都强调数据量要有多大,但是大数据最关键的是,一是要关联才能产生价值,二是越流通越能产生价值。
数字化本质就是数据的获取、治理和使用,就是“取、治、用”,这是最根本的。无论是物联网还是电商,其实数字经济和企业的数字化转型,最底层的改变就是这三件事情,取数、治数和用数。
在微观企业里的数据开始被系统性地采集、治理和应用之后,开始在产业链上共享和流通,并产生了巨大的价值。