Michael_Shentu
码龄17年
关注
提问 私信
  • 博客:1,888,579
    社区:3,246
    视频:2
    1,891,827
    总访问量
  • 229
    原创
  • 1,237,050
    排名
  • 1,171
    粉丝

个人简介:感兴趣方向:分布式计算与存储,广告计算学,分布式数据挖掘与机器学习,Hadoop,Spark,HBase

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2008-06-16
查看详细资料
个人成就
  • 获得1,388次点赞
  • 内容获得171次评论
  • 获得2,332次收藏
创作历程
  • 6篇
    2024年
  • 34篇
    2023年
  • 3篇
    2020年
  • 34篇
    2018年
  • 77篇
    2017年
  • 66篇
    2016年
  • 36篇
    2015年
  • 38篇
    2014年
  • 7篇
    2013年
  • 1篇
    2012年
成就勋章
TA的专栏
  • linux系统环境运维
  • Hadoop分布式系统
    19篇
  • HBase分布式存储系统
    7篇
  • 机器学习
    63篇
  • 职场生涯
    3篇
  • Spark 分布式内存计算模型
    38篇
  • 高级程序设计
    10篇
  • 最优化理论
    11篇
  • Hive 分布式数据仓库
    10篇
  • 自然语言处理
    14篇
  • 特征工程
    37篇
  • Flink实时计算平台
    13篇
  • DeepLearning4J
    5篇
  • 正则化
    3篇
  • MongoDB
    4篇
  • 风控与反欺诈模型
    11篇
  • 损失函数
    4篇
  • 深度学习
    10篇
  • scala开发语言
    8篇
  • xgboost
    9篇
  • Tensorflow与深度学习
    21篇
  • TypeScript&JavaScript框架
    2篇
  • 计算广告
    1篇
  • linux系统服务运维总结
兴趣领域 设置
  • 数据结构与算法
    推荐算法
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

saas 多租户系统数据隔离方案

关注WX公众号: commindtech77, 获得数据资产相关白皮书下载地址1. 回复关键字:数据资源入表白皮书下载 《2023数据资源入表白皮书》2. 回复关键字:光大银行下载 光大银行-《商业银行数据资产会计核算研究报告》3. 回复关键字:数据资产估值下载 《商业银行数据资产估值白皮书》4. 回复关键字:上海银行下载 上海银行《商业银行数据资产体系白皮书》5. 回复关键字:商业银行数据资产管理下载 《商业银行数据资产管理体系建设实践报告》
原创
发布博客 2024.01.01 ·
1402 阅读 ·
25 点赞 ·
0 评论 ·
21 收藏

论数据资源持有权(下)

这就为未来的商业组织架构提出了新的挑战。因为数据的无体性与可复制性,数据资源虽流转出去,但数据参与者仍留有原数据,当该数据参与者再次对留存之数据进行生产加工,则又基于数据财产的使用而享有数据资源持有权,如此往复,即数据参与者在自我不断对数据资源进行生产加工以及数据资源在不同数据资源持有者之间的流转传输中,实现数据资源流通交易秩序之构建。而对于数据资源持有权主体自行收集生产之数据也需确保其爬取数据行为符合互联网协议,而不能随意抓取数据,数据资源持有权主体应在数据流通体系中自觉维护数据秩序,预防数据风险。
原创
发布博客 2024.01.01 ·
1031 阅读 ·
18 点赞 ·
0 评论 ·
17 收藏

论数据资源持有权(上)

关注WX公众号: commindtech77, 获得数据资产相关白皮书下载地址1. 回复关键字:数据资源入表白皮书下载 《2023数据资源入表白皮书》2. 回复关键字:光大银行下载 光大银行-《商业银行数据资产会计核算研究报告》3. 回复关键字:数据资产估值下载 《商业银行数据资产估值白皮书》4. 回复关键字:上海银行下载 上海银行《商业银行数据资产体系白皮书》5. 回复关键字:商业银行数据资产管理下载 《商业银行数据资产管理体系建设实践报告》一、问题的提出:探寻新型数据产权构建的方向由于
原创
发布博客 2024.01.01 ·
962 阅读 ·
18 点赞 ·
0 评论 ·
18 收藏

数据资产入表之——数据确权

本文将围绕数据资产管理过程中的数据确权问题展开探讨,首先介绍数据资产入表的背景,其次探讨权力以及权利的划分方式以及标准,接着分析数据权力与权利包含的范围,再探讨数据确权的内部问题,然后探讨数据确权的外部问题,最后提出数据确权的建议方案。由于数据据有可复制可传播的属性,如果不进行确权,会导致数据滥用的情况发生,确保数据资产流通的唯一合法性这样才有助于形成新的数据要素市场,开启新的财富活动,是数据要素市场化的前提。数据确权是指确定数据的所有权、使用权、转让权、许可权等权利的归属,以及这些权利的行使方式和范围。
原创
发布博客 2024.01.01 ·
1079 阅读 ·
20 点赞 ·
0 评论 ·
8 收藏

数据的确权、流通、入表与监管研究(一):数据与确权(下)

另外一类是病人症状、身体状态等的记录,这些数据一些来自与医生的询问、观察,一些来自于各种医疗检查设备、仪器的检测,如:X光片子、血检的各项结果等,这些数据应属于病人,而非医院,根据本文前面的确权规则,这些数据完全取决于病人,而非医院的检测手段,病人为诊断和治疗而允许医院对这些数据的采集(数值化)和处理,但这些数据仅仅与病人相关,病人在任何一家规范的医院进行检测都会得到同样的数据。从第一节的模型可以看到,非指令类数据相关的基本权利可以分为三个,即:数值化的权利、处理的权利和现实化的权利。
原创
发布博客 2024.01.01 ·
1131 阅读 ·
26 点赞 ·
0 评论 ·
25 收藏

数据的确权、流通、入表与监管研究(一):数据与确权(上)

小结一下本节的结论:赛博空间数据可以分为指令类数据和非指令类数据,非指令类数据可以进一步分为原始数据、次原始数据、模型类数据、统计预测类数据、决策结论类数据、自动执行类数据。数据存在于“赛博空间”中,“赛博空间”是一个“人造”空间,现实空间与赛博空间的交互,本质仍是人与世界的交互作用,这一特性决定了赛博空间的所有规律都与现实空间有着本质和联系,这也是数据相关问题研究和分析的最基本原则。“原始数据”是现实空间对象在赛博空间的最初始“映射“,”衍生数据“则是”原始数据“和其他数据在赛博空间内处理后生成的数据。
原创
发布博客 2024.01.01 ·
1026 阅读 ·
28 点赞 ·
0 评论 ·
22 收藏

数据的确权、流通、入表与监管研究(二)数据与流通

这些数据的精度、范围差异很大。两种含义的服务下,都会涉及到数据在不同子空间之间的流动,但是否都是本文所讨论的数据流通和交易,则需要从服务接受者对所接收数据的处理权限范围和程度来判断,只有那些服务接受者能够自主决定对数据的处理方式、手段、逻辑(或者说,自主决定用于处理数据的”程序”)的才是本文讨论的数据流通和交易。现实情况下,数据流动并不一定是为了处理,比如:通信过程,数据从通信终端进入通信网络,是一种数据流动,但严格意义上的通信网络并不会处理终端所发送的数据以生成新的数据,而只是将数据送到接收终端。
原创
发布博客 2023.12.31 ·
933 阅读 ·
13 点赞 ·
0 评论 ·
23 收藏

数据资源将被视为资产 明天起纳入财务报表

以“数据要素×科技创新”为例,《行动计划》提出,以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。具体而言,以推动数据要素高水平应用为主线,以推进数据要素协同优化、复用增效、融合创新为重点,通过强化场景需求牵引,带动数据要素高质量供给、合规高效流通,培育新业态、新模式,充分实现数据要素价值,为推动高质量发展提供有力支撑。二是适时启动“数据要素×”大赛。
原创
发布博客 2023.12.31 ·
494 阅读 ·
7 点赞 ·
0 评论 ·
5 收藏

数字资产学习笔记

同时,标准化的数据资源也有利于管理,通过数据治理更好体现数据资源价值)、数据资源盘点(按照分类将所属的数据资源盘清的过程,该过程有利于盘清数据资源底数)、数据资源认定(根据盘点的结果确认为是企业数据资源)等工作,并形成支持财务核算的各类原始档案。要实现数据资源入表,必须以管理会计思想为指导,以应用场景为依托,建立数据、模型、应用的三层架构的思维方式,通过数据治理,达到数据规范、质量可靠、及时全面、维度丰富、融会贯通、赋能决策的目标。通常情况下,数据成本包括:数据规划成本、数据获取成本和数据处理成本。
原创
发布博客 2023.12.30 ·
983 阅读 ·
19 点赞 ·
0 评论 ·
23 收藏

对“企业数据资源相关会计处理暂行规定“的个人理解

如果是买了数据资产,初始计量成本包括购买价款、相关税费,直接归属于使该项无形资产达到预定用途所发生的数据脱敏、清洗、标注、整合、分析、可视化等加工过程所发生的有关支出,以及数据权属鉴证、质量评估、登记结算、安全管理等费用。2023年8月21日,财政部发布了《企业数据资源相关会计处理暂行规定》,明确:企业应当按照企业会计准则相关规定,根据数据资源的持有目的、形成方式、业务模式,以及与数据资源有关的经济利益的预期消耗方式等,对数据资源相关交易和事项进行会计确认、计量和报告。1、数据资产化,增加了企业资产总额。
原创
发布博客 2023.12.30 ·
1155 阅读 ·
25 点赞 ·
0 评论 ·
19 收藏

《企业数据资源相关会计处理暂行规定》学习笔记

因此,数据资源入表,更应该要的是数据资源创造价值。数据需要通过合理的数据治理体系对元数据、数据进行治理,并建立数据存储机制、数据开发管理体系、数据架构管理体系、数据安全管理机制、数据内控制度、数据服务管理体系,达成数据资源盘点、数据质量提升、数据指标建立与持续优化、数据运营管理,进而实现数据考核与评价体系。一般情况下,只有面向业务场景的才是符合资产定义且满足确认入表条件的数据资源,而面向面向中后台管理类场景、面向监管类场景、基础数据治理类场景,基本上无法量化价值,更符合纳入可披露的数据资源范畴。
原创
发布博客 2023.12.30 ·
1088 阅读 ·
15 点赞 ·
0 评论 ·
18 收藏

实时数仓应用价值(下)

Kappa架构将多源数据(用户日志,系统日志,BinLog日志)实时地发送到Kafka,然后通过Flink集群,按照不同的业务构建不同的流式计算任务,对数据进行数据分析和处理,并将计算结果输出到MySQL/ElasticSearch/HBase/Druid/KUDU等对应的数据源中,最终提供应用进行数据查询或者多维分析。首先将各种来源的数据接入ODS贴源数据层,再对ODS层的数据使用Flink的实时计算进行过滤、清洗、转化、关联等操作,形成针对不同业务主题的DWD数据明细层,并将数据发送到Kafka集群。
原创
发布博客 2023.12.30 ·
976 阅读 ·
21 点赞 ·
0 评论 ·
27 收藏

实时数仓应用价值(上)

这种方式的特点使架构变得更加简单,但是不足之处是需要保障数据都是实时的数据,如果数据是离线的话也需要转化为流式数据的架构进行数据处理,具体架构可结合这张图来看。这种架构的优点是离线数据和实时数据各自计算,既能保障实时为业务提供服务,又能保障历史数据的快速分析。实时数仓架构可以提高数据处理的速度和效率,使企业能够更快地获取数据洞察,从而更好地支持决策和业务运营,为企业提供更好的数据支持。但是有一个缺点是离线数据和实时数据的一致性比较难保障,一般在离线数据产生后会使用离线数据清洗实时数据来保障数据的强一致性。
原创
发布博客 2023.12.30 ·
1064 阅读 ·
23 点赞 ·
0 评论 ·
16 收藏

推荐系统_离线LR模型训练:点击样本获取与用户画像合并

发布视频 2023.12.30

推荐系统_离线LR模型训练:模型排序方案业务介绍

发布视频 2023.12.30

大数据实践之路 读后感

本书所讲的知识框架比较完整,偏基础,但是似乎有点太完整,我倒觉得再有一点实际可能遇到的问题,怎么解决,可能会好点。毕竟实际业务纷繁复杂,变化和影响因素很多。适合数据中台搭建、数分人来看。
原创
发布博客 2023.12.29 ·
838 阅读 ·
21 点赞 ·
0 评论 ·
27 收藏

商业银行数据资产管理体系建设实践报告.pdf

发布资源 2023.12.29 ·
pdf

用友BIP数据资产入表解决方案 发布与详解.pdf

发布资源 2023.12.29 ·
pdf

数据资产专题1:定义、区分、特征

学者侯彦英对数据资产提出三层定义:一是广义数据资产,即通常意义上的数据资源,是企业对各类活动和行为的物理或电子记载,其产权并不明晰,且价值模糊不可估计。二是管理学或统计学意义上的数据资产,数据具有明晰的所有权和控制权,但如果其价值无法科学合理估计,无法参与到资源配置活动中来。三是会计学意义上的数据资产,可以被企业拥有和控制,且可以合理评估其价值,具备参与资源配置活动的能力。对于入表、流通和交易而言,只有具备了会计学意义上的数据资产,才可能参与到要素市场活动中来,成为参与分配的要素。
原创
发布博客 2023.12.29 ·
1141 阅读 ·
20 点赞 ·
0 评论 ·
18 收藏

数据资产专题4:入表

具体来看,企业使用的数据资源,符合《企业会计准则第 6 号——无形资产》规定的定义和确认条件的,应当确认为无形资产,并按照无形资产准则等规定对确认为无形资产的数据资源进行初始计量、后续计量、处置和报废等相关会计处理。企业日常活动中持有、最终目的用于出售的数据资源,符合《企业会计准则第 1 号——存货》规定的定义和确认条件的,应当确认为存货,并按照存货准则等规定,对确认为存货的数据资源进行初始计量、后续计量等相关会计处理。企业出售确认为存货的数据资源,应当按照存货准则将其成本结转为当期损益;
原创
发布博客 2023.12.29 ·
1130 阅读 ·
26 点赞 ·
0 评论 ·
17 收藏
加载更多