自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 数字化、信息化、智能化之间的区别辨析!

提到数字化,就不得不提到信息化和智能化,这两个概念与数字化密切相关,似乎都与数据联系紧密。但实际上,数字化、信息化、智能化,三者具有完全不同的概念内涵,本文将重点探讨这三者的区别与联系。

2023-09-20 15:56:01 179 1

原创 如何区分“数据”、“信息”、“知识”,和“智能”?

智能的具体表现形式是数据模型,这些数据模型具有分类或预测的能力,可以基于已知信息推断得到有利于业务决策的未知信息,甚至基于算法的推断结果还可以自动产生相应可靠的行为活动。从数据中直接提取的信息很多时候往往是离散的、碎片化的,而知识则具有比较严格的内容组织形式,在信息节点之间,具有比较明显的和统一的关联关系。来看,数据可以分为:事务数据、文件和内容、主数据、参考数据,以及元数据等,其中,元数据又进一步分为业务元数据、技术元数据、操作元数据。数据是客观世界上直接可得可见的数字化内容,是信息的直观物理表现形式。

2023-09-20 15:47:14 88 1

原创 关于数字化转型的20个关键问题“盘点”

20个问题,深入浅出,快速了解什么是数字化转型,以及数字化转型中的关键数据分析问题。

2023-09-20 15:42:08 95 1

原创 关于“数据中台“的十个经典问题

数据中台是数字化转型中非常具争议的话题之一。有些人说,中台已经过时了,也有不少人说,不做中台,数字化转型就是无本之木,没有“落地”载体。

2023-09-20 11:32:20 92 1

原创 “概念模型”、“逻辑模型”,和“物理模型”之间的区别

数据模型分为三个层级,抽象程度上由高到低依次是概念数据模型(Concept Data Model,CDM)、逻辑数据模型(Logical Data Model,LDM),和物理数据模型(Physical Data Model,PDM)。低抽象程度的数据模型是在高抽象程度的数据模型基础之上的具体内容细化 ...

2023-09-20 11:20:31 326 1

原创 系统介绍:数据标签与数据指标

数据标签和数据指标,是对数据进行分析得到的两种重要的数据结果表现形式,可以对数字化业务应用提供重要的信息服务支撑,同时也是企业的重要数据资产类型。

2023-09-20 10:56:44 175 1

原创 数据的“价值属性”—观点分享

数字化转型的基础,是承认数据的价值属性。一切数字化实践活动,都是建立在认为数据具有价值属性这个重要的前提假设之上的。本文我们讨论一下,如何理性看待数据的价值,以及如何有效地利用和发挥数据的价值,赋能各行各业的数字化转型实践。

2023-09-20 09:16:02 58 1

原创 大型传统企业数字化转型难点与策略

早期的信息化建设为了保证效率,业务人员和技术人员的工作职责边界“过于”清晰,最终,彼此对各自的领域几乎没有任何基本常识和理解,难以形成有效的能力协同。“烟囱式”的架构难以对前端的数字化需求快速响应,同时,也无法充分发挥企业以数据要素为中心的新型管理创新模式,大量潜在的数据资源价值无法有效释放。值得注意的是,数据治理和数据标准制定,均需要以数字化目标为中心有序开展,切记盲目投入,整个实施过程需要不断产生“可见”效果,才能持续进行。因此,数据缺少维护和确认。

2023-09-20 08:58:43 38 1

原创 数据治理,到底为什么这么难?

因此,为了真正做好数据治理工作,很多时候要关注的不是治理本身,而是数据管理机制的建设,数据责任的落实,数据质量评价和整改的自动化处理技术,以及数据系统的流程控制与审核等等 ... ...很多企业主在探讨到数据治理以及数据中台建设的必要性,难以下决心,也正是这样的原因,归根到底,是因为对数据的认知不足,不理解到底为什么数据质量好坏会对当前的业务,甚至未来的业务产生影响。数据治理是应用导向的,知道数据怎么用,数据用在哪,才能“倒推”出来究竟需要治理什么内容,怎么治理,以及治理到什么程度才算够用。

2023-08-20 07:46:38 69 1

原创 判别式模型与产生式模型解析(Discriminative Model vs. Generative Model)

学习Machine Learning的朋友们一定会接触到两个概念,判别式模型(DiscriminativeModel)和产生式模型(Generative Model)。很多技术贴都尝试对二者进行详细的解释,但是往往由于初学者的积累不够,不能迅速理解其中的内涵,于是本文不吝笔墨对其再进行梳理一翻,希望对初学Machine Learning的学者提供一些理论性的支持。

2015-07-12 11:59:15 1877

原创 浅谈LDA主题模型(一)

       文本挖掘是大数据应用的十分关键的技术之一,对网络上海量的User generatedContent进行商业分析大多离不开对于文本的处理。对文本进行分析分为有监督的方法和无监督的方法。这里涉及了两个概念,“有监督”和“无监督”或许让对数据挖掘没有太深入基础的朋友们有点恍惚,说简单了,有监督方法就是用户预先给出一些学习的实例,对文本内容进行标注,然后计算机程序通过分析”人”对于文本的...

2015-07-06 12:36:33 2314 1

原创 原来很容易! 清晰解读MapReduce

       大数据时代的数据分析任务比传统的数据分析任务要复杂,因为往往涉及的数据量巨大,比如要分析汇总某个大型零售商在全国的销售数据,查看某个搜索引擎的特定词条的访问日志… … 通常来讲,我们的笔记本电脑可以同时干很多事儿,比如听音乐,编辑Word文档,下载电影,这些都可以同时进行,为什么呢?因为这些程序任务所处理的数据量规模小。而对于大规模的数据处理任务来说,就不是一台电脑同时做许多任务了,...

2015-07-06 12:25:19 655

原创 大数据の协同过滤——发现新的兴趣点

智能推荐算法是电子商务领域中非常关键的大数据应用技术。B2C平台上的智能引擎可以根据记录的用户信息,对用户感兴趣的商品进行推荐,从而促成更高的成交额。实现智能推荐需要对用户的行为规律、兴趣爱好、购物能力等诸多方面的信息具有充分的了解,因此,成熟的B2C网站都会客户的相关信息进行详细的存储统计。当对用户进行产品推荐时,智能引擎所采用的推荐策略大致可以分为两类:基于内容的推荐策略和协同过滤推荐

2015-06-26 15:43:04 1348

谷歌GFS存储架构论文详解

Google对于分布式存储的论文原文详解;英文原版;

2015-07-06

MapReduce Simplified Data Processing on Large Clusters.pdf

Google的MapReduce并行计算原始论文详解。

2015-07-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除