自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 从治理到“智”理,打造新一代金融数据体系

摘要:长期以来,很多金融机构的数据治理效果一直不尽人意,这已经成为金融科技公认的重要需求与固有难题。以大模型为代表的新一代人工智能有望彻底改变这种状态,它通过以自然语言而非专业技术驱动的人机交互界面,以及对人类专业经验与流程执行效果的良好模拟,能有效解决传统数据治理体系与工程中的诸多难点,大力推动人工治理走向自主“智”理,并最终形成新一代的金融数据体系。1. 前言数据治理长年以来一直是最重要的金融科技领域之一,从本世纪初金融机构开始实施企业级数据仓库(EDW)开始就一直被持续关注,并不断进行着相关的建设与改

2024-06-19 22:01:29 940

原创 战略决定生死,细节决定成败

正所谓:“有道无术,术尚可求,有术无道,止于术也”,在战略与问题两者的对比上,战略的重要性无疑更高,它是决定生死的因素。在此前提下,本文则强调,应该同步重视具体问题的解决,以及对细节的关注,这也是成功的关键要素。有一部电影,叫“养蜂人”,其中有这样一个情节:美国FBI特勤局需要阻止“养蜂人”进入总统的庄园,于是做了全面的安保规划,包括技术、人员、武器、环境等多要素联动整体策略,多级防护措施,各项高端技术配套,多种武器配备,多兵种人员布置,......等等,可谓考虑全面、技术先进的战略级规划。

2024-05-12 22:27:45 311

原创 “专家”论

换句话说,平时,我们在做一些决策时,都希望请“专家”们来评一评,这些专家可能有头衔、有职位、有名声,但首先需要确定是不是真材实料的真专家,否则,从他们那里获取的意见,可能会耽误事。实际上,本文认为,从现实的情况来看,我们周围有真水平的,符合上述必要条件的专家,是凤毛麟角,这自然是由浮躁的学术氛围造成的。在本文的认知里,基本没有。同样的,电影里(现实里也是一样)的科学家们,在自己的领域内,如物理、化学、数学、实验,都是亲力亲为,对一个个具体问题,研究、实验、计算、设计、讨论......。

2024-04-27 13:00:51 258

原创 上帝掷不掷骰子?又来了

现代人工智能推进的核心目标是“世界模型”,即能真正理解物理世界运行的模型,这一点是已经达到共识的,具有争议的是如何制造世界模型,谁才是真正的世界模型?有专业分析文章认为:Sora 将视频编码映射到隐空间,再切割成时空补丁形成时空令牌,用Transformer学习在上下文中令牌间连接的概率分布,这会导致局部合理与整体荒谬的矛盾(如Sora生成的“幽灵椅子”视频),用Diffusion模型计算传输映射会导致临界态图像的生成被直接跳过,从而造成临界状态的缺失的物理谬误(如Sora 生成的果汁泼溅与小狗视频)。

2024-02-22 18:37:54 349

原创 Sora、MGC与新数字时代的两个世界

首先来看元宇宙的数字世界。本文从新数字时代人类社会的两种存在形态:数字世界(元宇宙)与物理世界(时空宇宙),以及新兴数字产业:机器生产内容MGC的发展、现状与未来出发,通过对新数字时代及两个世界组成与运行的关键需求与核心要素分析,重新定义了现代MGC产业的概念,明确了其在新世界中的地位,提出并系统阐释了以MGC为主体,赋万物为媒,建设连接新时代数字世界与物理世界的心流时空隧道(Mind-Spacetime Tunnel)的创新产业工程规划:虫洞工场(Wormhole Workplace)。

2024-01-28 21:34:02 989

原创 兼容并包,海纳百川,成就已所不能

有时甚至认为是对手或者不喜欢,只要是对的意见与建议,就耐心征询并拿过来:我要的是你的意见为我所用,关你什么事?有几种情况,有的本身过于优秀,有的过于自负,有的把面子排在把事情干对前面,有的因下意识不舒服就盲目反对......,这些其实都关乎同一件事:心胸。这里认为,成就已所不能的关键,是“兼容并包,海纳百川”。简单讲,就是心界开阔,能包容并善于综合利用各方面的资源,弥补自己的不足,达成自己的目标。简单讲,好的干部,特别是责任多而重的干部,心胸开阔是极其关键的,甚至是决定性的因素。

2023-08-20 11:06:47 176

原创 “担浪乐坚”,建设“好”团队

首先,要有一支能主动“担责”的干部团队,而不是只以“负责”本职工作为理由,对非“定义”职责范围内的事情“漠不关心”“高高挂起”,甚至在有事找到他时,连路由都懒得做,直接回绝。当然,在“浪漫”之余,要加一条:同时能脚踏实地,不轻率,充分结合自身实际,有效地推动创新。总结来讲,“担责而不混乱”、“浪漫而不轻率”、“乐观而不自欺”、“坚定而不固执”,应该是一个好的干部团队所具有的。当然,这些其实并不是天上掉下来的,也不是一成不变的,它们更多的来源于经历与经验,很多人可能是缺乏磨砺,而更多的磨砺与反思,是关键。

2023-08-11 21:56:12 122

原创 在CPU上安装部署chatglm-6b实用经验分享

网上有很多材料,有的说安装TDM-GCC,有的又说安装mingw64,有的又说安装win64devkit,反正笔者自己的经验是:win64devkit(注意,可以多装几个,因为编译.so文件时,和运行时要求的,可能有时候要用不同的gcc,如果不行,就换一个,反正win64devkit编译下面的.so是没问题的)有很多网站都分享了一些经验,但不知道是不是环境的问题,笔者自己发现按照网上的文章,很多都走不通,也是自己综合各个文章,多次尝试,才勉强算是成功运行了!(1)下载官方代码,安装Python依赖的库。

2023-08-09 23:07:15 1274

原创 抬头看路,低头拉车,做有思想的行动家

很简单,如果方向错误,布局缺乏,策略失当,再多的苦劳往往难以得到理想的成效,甚至会背道而驰;而如果只会高谈阔论,整天空谈宏观愿景、目标与价值观,而不注重实战与落地,脱离团队,纸上谈兵,缺乏实战技能,对具体事宜与原因概不了解与不去探究,这样的人定的方向与策略,怎么能靠谱呢?这个“好”字可以包含很多方面的因素,如团结,专业等,但其中也有一个因素不可或缺,那就是:既能低头拉车,又能抬头看路。或许在研究型的象牙组织中,这个目标可以是“思想”,但企业型组织中,这个目标必须是“行动”,而不是“思想”。

2023-06-20 22:37:02 155

原创 数字安全智能操作系统

数字安全的核心理念在于改变信息化时代安全以防护为主体的状态,以稳态的“防护型”安全为基础底座,以敏态的“操作型”安全为价值主体,为数字经济运行提供“操作”(Operational)与“防护”(Protective)并重的、“敏稳双态”的现代安全体系

2022-11-09 12:24:16 820 1

原创 从“防护型”到“操作型”——现代安全发展之未来

在数字化时代,“安全”必然走出传统“防护”作用的历史地位,走到参与并驱动人类价值创造与流通的“操作”进程中去,因此本文称之为“操作型”安全(Operational Security),而这正应该是“数字安全”一词的本质涵义

2022-10-01 12:50:05 871

原创 数字城市新型基础设施——打造以“运营与安全并重”为特色的新型数字空间

打造以运营与安全并重为核心特色、以城市为对象的新型数字空间

2022-09-20 20:53:03 3020

原创 元安全引论

元安全代表数字空间的安全体系,由于现阶段业界通常用元宇宙一词代表数字空间,因此本文称之为元安全,由元身份、元资产、元计算三大部分组成

2022-09-05 16:42:20 2594

原创 论解决方案架构师的素养

一个解决方案架构师应该具有的素养,即技术深广度、架构方法论与领域资深专家三个方面

2022-09-03 21:39:51 1037

原创 数据安全互操作网络:数联网——数字经济新型基础设施

新时代的安全必将直接融入到数字社会的运行与价值创造中,“数据安全互操作网络”正是践行这一革新的关键行动之一,其中密码是核心,而这正是“数字安全”一词的本质涵义

2022-09-03 15:51:43 2505 1

原创 隐私计算开源平台Rosetta部署分享

Rosetta是一个方便、高效又实用的隐私计算开源平台,但其部署有不少的坑,作者踩过这些坑以后,在这里跟大家作以分享,以使同学们能一次就部署成功。在Rosetta github的repo里,有关于部署步骤与环境要求,如下:环境要求:Ubuntu (18.04=)Python3 (3.6+)Pip3 (19.0+)Openssl (1.1.1+)TensorFlow (1.14.0=, cpu-only)CMake (3.10+)部署步骤:git clone -

2022-05-06 20:34:40 1176 1

原创 数字金融新型基础设施---金融产业数字化能力引擎

摘要:本文提出数字金融新型基础设施的概念,指出其定位,提出架构模型并进行各核心组件的介绍。数字金融体系建设的核心是打造区域金融协同一体化运行的新型基础设施,数字金融新型基础设施的核心理念是“赋能”,从“授人以鱼”转向“授人以渔”,在其驱动下,业务系统由独立开发进化为基于公共业务能力的组装式自主编排生产,即“系统是模块,业务是模板”;数据体系由集中管理与分析进化为基于公共数据能力组件的自主定制消费,即“消费是核心,管治是基础”;数据要素与服务要素流通互联共同形成“数联网”+“业联网”的数字化协同互联能力;同时

2022-03-18 23:05:00 2053

原创 再谈因果性与不确定性

听说耶鲁大学最新的研究与试验成果证明了:量子力学的不确定性实际也有规律可循,只是因为其速度太快,接近“普朗克尺度”,很难被感受到而已。先不论这个试验成果是否真的对量子力学基础理念有这么大的颠覆作用,这里想借机再讨论一下因果性与不确定性。记得最早的一本大数据书籍,给人们带来了数据分析领域新的观点:大数据的根本特征是不遵循因果性。意思就是说,采用大数据思路解决问题,不需要考虑因果,可能用大数据得到的结论表面上看与输入或者其它因素并没有明显的、可理解的关系,但大数据这么说了,那就是这样,即:让大数据自己说

2022-03-06 23:19:20 2105

原创 从单点到分布式的哲学启蒙

1. 引子今天看到一篇技术文章,讲到从mysql迁移到tidb,为避免热点问题,将auto_increment自增ID主键改变为预分片RowID的技巧,从而能充分利用分布式资源的优势。这表面看是一个应对小问题的小技巧,但如果深入探讨,却可以引发从单点迁移到分布式,包括数据与应用迁移的方法论思考。2. 平移与重构的思考随着数字化转型的不断深入,在线数据量需求的增加,以及场景化带来的业务敏态进化趋势,近年来,从单点技术体系迁移到分布式技术体系,已经形成不可逆转的热潮。这其中涉及到很多具体..

2022-02-12 19:48:02 1504

原创 从云原生数据库服务到新型“数联网”基础设施

1. 新型“数联网”基础设施2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(下称《2020数据要素意见》)发布以来,数据要素的市场价值日益受到重视。同时,长期的实践证明,数据要素的威力,大多数情况下源于对多源数据的融合分析,单一组织靠自身积累往往难以聚集足够价值的数据,因此,只有通过数据跨域流通与共享开放才能真正发挥大数据的应用价值。如银行、保险、政府、电商等等行行业业,已经有了强烈、广泛的数据跨域集成与融合的市场需求。另一方面,随着数字化的深入发展,信息技术已经开..

2022-02-05 17:39:13 1736

原创 Paxos协议与分布式事务的通俗解释

Paxos协议与分布式事务都有两个阶段,很容易被人所混淆。实际上,这两者在使用中有关联,但场景却有所不同。大部分介绍材料,都过于学术化,描述过于复杂,让大多数人看了后似懂非懂,导致现实中很多同学对这两者本身,以及两者的区别,也一直处于似懂非懂的状态。本小文试图用最简单、最简短的语言,对这两者及区分进行说明。一、先看Paxos协议,也可以称为一种算法,主要用于分布式节点之间关于某项决策保证一致性,决策的原则就是少数服从多数。跳过复杂乏味的算法过程描述,直接举例说明:要解决的问题:一群朋友决定一

2022-02-03 20:27:03 569

原创 在CentOS上进行TiDB编译分享

这里对TiDB的编译过程中的几个小点进行分享。虽然理论上讲,从github上下载的源码解压后就能实现编译,但实际操作过程中,由于各种各样的原因,还是有可能出错,本文对实操过程中的几个问题及解决方案进行分享。本文用的环境是CentOS 7.4环境准备(1)golang编译环境golang的编译环境,很多文章上都建议直接用yum安装,如下:yum install golang -y这样是可以的,但是要注意所安装golang的版本,跟所配置的yum源有关,一般情况下,不是最新版本

2022-01-25 00:00:08 895

原创 用MapReduce实现机器学习小例

用分布式的并发计算能力来实现机器学习算法,是AI实践领域比较重要的方向,因为对海量数据的AI计算来讲,往往单机的能力严重不足,在自己机器上做点实验进行学习可以,但在实际工程中,特别是在所谓的大数据时代,往往需要借助分布式并行计算的能力。当然,已经有很多框架,比如MPI,Hadoop的Mahout,Spark ML、参数服务器等等,在工程中可以供开发者使用,不过,如果要对用分布式来实现机器学习的方法论与过程有更深入的理解与掌握,自行编程进行相关方向的实验,是需要的,在工程中,这种深入的体验也很有可能会

2022-01-19 16:22:10 2449

原创 关于HTAP与HSAP

交易分析混合负载HTAP方兴未艾时,同时,还有一个新的概念在业界流转,即HSAP,Hybrid Serving & Analytical processing 服务分析混合负载。1. 概念在讨论HSAP之前,首先需要了解其概念中对服务与分析的区分。相当多从应用角度对数据处理分类的划分,大致分为Transaction交易与Analysis分析两大类,一类位于企业数据架构的上游用于生产数据,一类位于企业数据架构的下游用于数据价值的利用。而HSAP则对位于下游的数据价值利用进行了进一步的区分:

2022-01-16 17:06:37 4318

原创 灵境元宇宙 ---论元宇宙之本真

有人会说,你提“灵境元宇宙”,不是等于说“咪咪猫”,把两个完全一样的东西并列成词吗?其实,这里提出“灵境元宇宙”,是因为目前业界,对元宇宙的概念并不统一,各衷其是,本文意图对元宇宙的概念析毫剖厘,溯本归源,探求其本真的涵义。元宇宙之惑元宇宙的概念很火,有相当多的声音认为它就是数字孪生的世界,在那里,人们带上VR眼镜,可以获得类似真实的体验;可以有数字分身,在里面进行社交、会议、游戏甚至观景等活动;有认为其是下一代感知更真实的互联网基础设施;同时有部分声音也把区块链、NFT等其它火热的技术与概念加了进来,

2021-12-30 12:00:27 475

原创 论分布式数据库架构的“存”与“算”

在云计算基础设施IaaS服务中,“存”与“算”的分界是清晰的,客户会分别为“存”与“算”按需消费。不只是专门的存储服务如S3、对象存储、块存储、NAS等,即使是在最基本的虚拟机服务ECS上,“存”也需要由消费者进行选择,而选择的对象是云盘,即位置对用户透明,不需要消费者关心是否在计算节点的本地:其实连计算节点本身位于何处也是无需关心,又何谈本地。随着云计算服务的持续发展,“存”与“算”的界限,无论是从消费模式上,还是从技术上,都呈现出越来越清晰的趋势。而在PaaS层的数据库服务中,则出现两种情况。一种是

2021-12-25 13:08:11 1435

原创 大网站,小网银---谈谈网银网站融合

银行对互联网金融目前谈得很多,除了突破产品销售模式的企业平台战略(这一般都是与现有业务关联不大的全面创新,不在本文的讨论范围这列)以外,涉及最多的内容就算是各种金融业务的互联网改造了。而对银行来讲,在这一方面,最重要也是最先需要确定的,就是关于网银与网站改造的问题。众所周知,大多数银行很想从互联网电商那里取点经,无论是叫客户体验也好,叫个性化也好,在他们的金融互联网目标中,希望对现有的网银与网站进行改造,使其能像互联网电商那样,粘住更多的客户,实现优质的精准营销、交叉营销、二次营销等。而要达到这一目

2021-12-23 14:39:54 211

原创 三位一体集大乘---论互联网金融战略

导语:互联网企业对金融领域的涉足,在金融行业引起轩然大波,以银行业为代表,几乎所有的金融巨头们都在纷纷讨论与制定应对策略。然而,仔细观察与分析后会发现,虽然表面上相关话题热烈,甚至各种具体的创新与改进行动频繁,但对隐藏在现象背后的本质问题,似乎并不明了:到底是互联网企业的逼宫促进了金融企业对原本就需要并正在进行的改造行动加速,还是从根本上撼动了金融业的优势;另外各企业在互联网金融战略层面,也似乎并不那么清晰:互联网模式来了,在我的行业与企业,到底应该是一种自顶而下的全盘创新?还应该是一种自底而上的业务改进?

2021-12-22 22:45:53 13688

原创 交易数据库发展趋势:从账本到发动机

相当一般时间以来,无论有多少脍炙人口的技术进步,包括分布式架构,内存缓存,高并发,多地多中心多活等,交易数据库的核心目标一直都是存证记账。长期以来在该领域所追求的,就是无论我的业务量有多大,业务增长有多快,数据库都能及时的、准确地、可靠地将账记下来。对企业来讲,数据库的价值就是在任何情况下都能保证一个存证的账本。而近年来,数据库领域新的架构设计与技术进步,即HTAP(交易分析混合负载),却给了交易数据库在企业运营中新的定位与职能,那就是,企业业务运营的“发动机”。也就是说,过去,交易数据库的存在只是为了

2021-12-15 16:12:34 2218 1

原创 谈中国分布式数据库商业之路:OSM与DB-Inside

问题的提出中国的分布式数据库商业道路该怎么走?云原生运营还是产品式覆盖?这是一个需要讨论的问题,特别是对于中国市场来讲。云原生运营显然是国际范围内数据库服务的先进模式,这无论是从科技发展趋势上,还是从国际实践上,都已经得到证实。但在中国,由于超过8成的2B数据库市场都被政府与大中型国资所占据,而分布式数据库的主体市场正是2B,不是长尾,从而导致数据库厂商实施云原生运营的商业环境差。可以假设DB Cloud数据库自运营的模式在中国相当长时间内条件并不具备。那么,以市场占有率为目标的产品化模式又如何

2021-12-11 20:51:05 1228

原创 浅谈云原生数据库与跨域安全计算

云原生数据库,是支撑现代数据服务的主体设施,它生于云上,长于云上,对外形成按需获取的DBCloud形态,使用者无需关心数据计算与存储的具体细节,无需为部署、运维、扩缩等工作付出精力,无需对数据计算的模态(AP,TP,流,图等)做出额外的规划与设计,无需区分所选择云计算基础设施IaaS的特性与区别,只需要向云原生数据库DBCloud的运营者申请使用相应的服务即可,这是现代数据库技术与服务发展的必然方向。毫无疑问,在不久的将来,全球越来越多的数据服务将在云上,包括多云、跨云的环境中以平台化的方式实现。由于云计算

2021-11-29 16:14:17 1444

原创 “敏态业务”新说

“敏态”这个词,是较新流行的关于传统业务互联网化的描述,而其背后主要想表达的意思大多被理解为业务可随时无感扩缩,以适应在时间和空间两个维度上都无处不在的、碎片化的、精细化的新一代业务数字化转型的要求,而在技术上也大多被映射为微服务化的应用与Scalable SQL的数据库。这里认为,“敏态业务”一词,除了上述“业务可随时无感扩缩”一个层面的解释外,还应该附加另一层的业务价值——“即时智能决策”。“即时智能决策”指可以在最新、最近的业务交易基础上,随时做出智能的“业务决策”,这也是新一代业务数字化转型必然

2021-10-29 13:00:33 3284

原创 再谈HTAP---论操作分析化与分析操作化

HTAP应该怎样来描述?这需要进行更加深入的讨论与抽象。交易的同时还能做些分析的分布式数据库也有很多,混合负载的提法其实也由来已久,并且都偏向于技术层面,缺乏更有业务特性的、更具代表性的表达。如果将HTAP定位为一种新兴的、有时代意义的架构与技术,那显然不能停留在这样的理解上。假若依据HTAP需要带来的IT架构转型(即“分析上移、数据普惠”)目标,以及重点的应用场景类别(即“分析内嵌的应用”与“数据服务超市”)来反向推导,则可以对HTAP做如下描述:HTAP是操作(Operationalizatio

2021-09-08 00:01:50 252 1

原创 HTAP驱动现代银行IT架构转型之路

HTAP作为一种新兴技术架构与能力,不仅可以带来某单一系统的功能与性能提升,更重要的是会驱动企业IT架构面向现代业务目标的整体转型升级。本文以典型银行IT架构为例,对HTAP驱动ITSP、应用架构、数据架构、技术架构转型升级,乃至面向新数字时代的业务能力提升赋能进行分析与介绍。1. HTAP与银行ITSP规划---“分析上移,数据普惠”HTAP首先带来的,是驱动从服务化、云计算与大数据时代以来,作为指导银行新一代IT架构各层级规划的已有高阶蓝图策略及组件布局进行调整。如下图1是典型的银行新一

2021-08-14 19:05:54 353

原创 HTAP数据库及应用场景简析

HTAP数据库,即交易分析混合负载型DB,已经成为一种流行的新型数据库。不仅概念很火,并且也在逐渐成为除OLTP、OLAP之外,越来越多数据库用户新的选型规范。然而,同时又存在一些现象:一是一夜之间,所有的数据库都变成了HTAP数据库;二是除了“能同时承载交易与分析SQL”这一极易模糊的理解之外,基本没有清晰明确的界定;自然而然,对HTAP的应用场景,也是八仙过海,各式各样,并不清晰的。这些,都导致HTAP有成为一种噱头的趋势。1. HTAP的界定这里认为,HTAP既然要成为一种新的标准与规范,

2021-08-12 23:37:47 3336

原创 论数据服务平台化的存在形态

数据服务平台化的本意是指对数据需求(包括交易、加工、分析等)用户来讲,其满足需求的方式是向“平台”提出请求即可,而不需要关心请求的具体实现过程。由于数据库是实现数据服务的核心主体设施,因此,从一定含义上来讲,它相当程度上就是云计算PaaS层服务DBaaS的代名词,也可以是数据库产品服务商对其云原生业务发展战略的高度概括。本文对数据服务平台化的讨论限制在数据库服务范畴之内。1. 问题的提出一般意义上来讲,人们对数据服务平台化作如是理解:未来IT服务的主体将由平台(即云)来承担,世界的IT基础设施将是N

2021-07-27 00:15:49 367

原创 NewSQL分布式数据库发展策略讨论

本文对新一代NewSQL分布式数据库发展策略中的普遍困扰进行讨论,试图厘清云原生(Cloud Native)与本地部署(On Premise)、HTAP进展方向、分布式与单机需求等分布式数据库商业与技术发展中难以决策的问题。1. 困扰分布式NewSQL数据库近年来蓬勃兴起,其原因显而易见:切中了业务与数据量不断增长的用户对关系型数据库RDBMS需求,这在传统RDBMS到大数据的发展阶段中,有相当一段时间是空白。同时,随着互联网技术的不断发展与普及,用云计算模式满足IT需求似乎已经成为未来社会产业

2021-07-19 00:11:42 3796

原创 分布式数据库TiDB应用分析

本文基于TiDB技术架构与功能,以及已有实践,对分布式数据库TiDB的应用场景、发展定位及相关问题进行研究分析与探讨,关于TiDB的架构与组件网上已经有很多材料,本文中除了应用探讨中需要的描述外,不对此做专门系统性阐述。1. 问题的提出TiDB是近年来兴起的新一代云原生强一致NewSQL分布式关系型数据库,简单讲,就是:又能分布式、又能强一致、又是标准SQL驱动的RDBMS。这几个特性在传统关系数据库受到挑战,而新兴的分布式大数据技术栈又多属NoSQL,无法满足ACID强一致交易的关系型SQL数

2021-07-11 22:25:41 818

原创 数据智能系列文章之二:机器学习的核心要素

本文介绍数据智能及机器学习方法的核心要素。从上面的定义可以看出,机器学习有三个核心要素:数据,用现在流行的提法,也可以叫大数据;算法:主要指数据处理与机器学习算法,主体关注机器学习算法;算力,即计算能力,由于进入现代,在大数据基础上进行智能计算,算力已经越来越成为一个不可忽略的要素了。1. 资料:大数据再析数据,显然是数据智能最本质的核心要素,是生产资料,是产生智能的母体。也就是说,人们所寻找的智能,蕴藏在数据之中,所有的其它要素,都只是协助从中将其发掘出来的手段而已。在BI作为数据工程主...

2021-06-14 12:10:04 2295 1

原创 关于NewSQL数据库对CAP的再解释

关于CAP的讨论已经很多,包括作者的另一篇文章“对CAP的初步解释”,基本已经即定思维的解释就是:分布式系统必须遵循CAP,一个分布式系统的设计只能同时满足其中两个,不可能同时满足;传统关系数据库选择A与C,代表了互联网新兴技术的NoSQL数据库则选择A与P(或者C与P,虽然这种情况其实需要详细讨论)。但是,近年来,新兴的NewSQL数据库(TiDB或者OceanBase),则是一种在分布式环境下,保证的ACID强事务特征的强一致性数据库,并且很显然,它同时也满足的高可用性与优秀的分区可容忍性(很好的可

2021-06-12 22:04:04 265 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除