【理论科普】大数据 | 云原生 | 机器学习 | 人工智能
文章平均质量分 90
初识不知文中意,再见已是文中人
一个写湿的程序猿
练习两年半的程序猿。。。只因(ji)你太美!!!
初识不知文中意,再见已是文中人
展开
-
模型、算法、数据模型、模型结构是什么?它们之间有什么关联和区别?
算法的定义有许多版本,但其核心思想是一致的。算法可以被定义为:一个明确的、有序的、有限的步骤集合,用于解决一个特定的问题或执行一个特定的任务。这个定义是非常通用的,适用于从最简单的日常生活任务(例如烹饪食谱)到复杂的计算机科学问题的算法。让我们详细分析这个定义:明确 (Clear):算法的每一步都应该是清晰、无歧义的,这样任何人都可以理解并按照算法的指示进行。有序 (Ordered):步骤的顺序是固定的,这确保了每次运行算法时,它都会产生相同的结果(如果输入和初始条件保持不变)。原创 2024-03-16 09:26:50 · 2090 阅读 · 0 评论 -
TEAM标签管理体系是什么?如何进行数据权益的保护?
挖掘金融业数据资源巨大价值的同时必须确保数据安全,注重对数据主体和数据持有者合法权益的保护。为解决这一过程中的实践难点,本文基于区块链技术,设计数据集动态标签管理“`TEAM`”体系——一个集`Tagging(打标)`、`Ensuring(保障)`、`Authorization(授权)`、`Monitoring(监控)`四大功能于一体的保护体系。该体系旨在使公共数据、企业数据、个人数据等各类数据信息在流通与价值释放过程中,能够得到与其安全需求相匹配的保护。原创 2024-03-16 09:20:59 · 1680 阅读 · 0 评论 -
数据指标是什么?为什么要建立指标体系?什么阶段建设?路径是什么?
看了下百度百科,竟然没有数据指标这个词条,看来这个词大家平时还用的不多啊。那只有间接偷懒一下,分别查下指标和数据这两个词条的含义,在组合起来看看。数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。指标:衡量目标的参数,预期中打算达到的指数、规格、标准,一般用数据表示。——来源《维基百科》数据是对事物结果的归纳,指标是衡量目标的方法。组合一下,数据指标就是可以对结果进行归纳的一种目标衡量方式。原创 2024-03-07 16:29:27 · 1000 阅读 · 0 评论 -
什么是主数据?主数据治理如何实施?
主数据是在多系统集成应用的背景下,被多个信息系统(或功能模块)共用的基础性标准化的数据。主数据是对企业核心业务而言非常重要的单一来源,并且具有唯一性、共享性、稳定性、有效性。换言之,主数据支撑业务流程和事务。其实主数据理解起来非常简单,比如记账,“谁,在哪个店里,买了什么东西,一共多少钱这句话里所有非数值的,都是主数据,买东西的人、卖东西的店、产生交易的商品等等都是主数据。常见的主数据包括:供应商、客户、物料、人员、部门、项目等。主数据,带个主字,英文是Master。原创 2024-03-06 11:39:54 · 1408 阅读 · 0 评论 -
世界算力简史(下)
我们说到,70年代微处理器崛起,使得个人电脑开始大量出现。这种情况,让传统巨头IBM感受到了威胁。一直以来,他们都专注于大型机,导致忽视了小型机的市场。为了亡羊补牢,他们也决定启动个人电脑研发计划。1980年3月,IBM召开一次高层秘密会议,设立“Chess(国际象棋)”项目,专门研发个人电脑(Personal Computer这个词,就是这时被IBM提出来的)。负责这个项目的,是唐·埃斯特利奇(Don Estridge)。他带领了一个13人小组原创 2023-08-14 09:35:16 · 367 阅读 · 0 评论 -
世界算力简史(中)
1944年,冯·诺依曼开始参与原子弹的研制。因为研制过程需要进行大量的计算,他就开始关注计算机相关的研究进展。经人引荐,他作为顾问,参与到了ENIAC的研究中。基于ENIAC的研究,冯·诺依曼等人在1945年又提出了一个新的方案——EDVAC(Electronic Discrete Variable Automatic Computer,电子离散变量计算机)。原创 2023-08-14 09:34:15 · 437 阅读 · 0 评论 -
世界算力简史(上)
1946 年 2 月 14 日,在美国宾夕法尼亚州东南部的费城,人们正在像以往一样正常工作和生活。忽然,他们发现,房间里的灯暗了下来。刚刚经历过二战的人们,对这种情况习以为常。他们心想:“是不是哪里的电力线路又坏了?”其实,灯之所以会暗,并不是因为线路问题,而是在离他们不远的宾夕法尼亚大学,诞生了一个“庞然大物”。这个“庞然大物”占地 170 平方米,重达 30 吨。它以电为生,功率高达 150 千瓦。它的启动,直接拉低了附近居民用电的电压,所以导致电灯变暗。这个“庞然大物”究竟是什么呢原创 2023-08-11 16:21:03 · 361 阅读 · 0 评论 -
2023大数据十大关键词是什么?湖仓一体、数据资产化、DataOps、数据服务、智能增强分析、数据伦理、数据基础制度、公共数据授权运营、数据安全风险评估、数据出境
随着我国大数据产业政策日趋完善、产业基础日益巩固、数据要素市场建设不断深化,大数据产业再次迎来巨大发展空间。6月26日至28日,由中国信息通信研究院、中国通信标准化协会主办,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办的2023大数据产业发展大会在京召开。在大会主论坛上,中国信通院云大所所长何宝宏发布了《2023大数据十大关键词》。原创 2023-06-26 20:00:00 · 625 阅读 · 0 评论 -
Iceberg 数据湖是什么?数据湖能解决什么问题?独立于计算层和存储层之间的表格层?
这样可以使用这些统计信息检查每个文件是否与给定的查询过滤器匹配,如果当前查询的信息并不在当前数据的范围内,还可以实现File skip, 避免读取不必要的文件。从上面的元数据文件可以看出,Iceberg 的清单文件中会记录每个数据文件所属的分区值信息,同时在清单列表中会记录每个清单文件的分区信息。从上图可以看出,Iceberg是在HDFS或S3存储引擎上的又一层,用于管理在存储引擎中的Parquet、ORC和avro等压缩的大数据文件,使这些文件更便于管理维护,同时为其构造出相应的元数据文件。原创 2023-04-15 08:00:00 · 1390 阅读 · 2 评论 -
五分钟了解GPT 模型背后的原理是什么?为什么 GPT 模型能生成有意义的文本?为什么 GPT 模型不会做简单的数学题?为什么有人担心 GPT 模型可能会危害人类?
1945 年,美国研制成功之后,在日本投下了 2 颗原子弹,造成超过 20 万人死亡,爆炸后释放了大量的核辐射,对人类产生长期的负面影响,导致癌症等健康问题,对生态环境造成巨大的损失,对人类安全造成严重的威胁。下面结合沃尔夫勒姆的文章、谷歌团队的论文、ChatGPT 的回答、以及万维钢的 AI 前沿课等内容,抛开一些技术的细节,结合自己的理解,尽量用比较通俗的语言,来解读 GPT 模型背后的原理。据说在 2021 年,美国有一个叫约书亚的人,他的爱人杰西卡因病去世,因此他感到伤心欲绝。原创 2023-04-11 11:17:45 · 4383 阅读 · 1 评论 -
Twitter的推荐系统开源了,Twitter的推荐系统是什么样的呢?Twitter推荐系统的架构说明
Twitter 的实时性带来了另一个独特的挑战:用户希望 Twitter 尽可能地接近实时,这意味着底层网络图是高度动态的,延迟成为一个真实的用户体验问题。研究人员表示,“我们考虑的特征及其各种互动的清单在不断增加,为我们的模型提供了更多存在细微差别的行为模式。像 Twitter 这样的社交网络就是超大图的实例,节点是用户和推文的模型,边则是回复、转发和喜欢等互动的模型。原创 2023-04-02 16:59:15 · 1657 阅读 · 0 评论 -
五分钟了解三门问题是什么?贝叶斯公式和蒙提霍尔问题有什么关联?
在维基百科对于 Monty Hall 问题的描述中,门的背后是山羊和汽车,本文替换成了矿泉水,但是数学原理是一样的,避免读者钻牛角尖。比如说数据规模不一样,9扇门,主持人帮你否定7个,显然要换,正是因为数据规模很小才带来了和直觉相悖的感觉。贝叶斯公式的意义非常重大,它揭示了条件事件概率的内在联系,某些样本信息的出现对先验概率的影响。设定参与者选择了A门,由于主持人默认需要选择没有汽车的门,因此参与者的选择影响了主持人的选择。条件概率是在某种条件下,某个事件发生的概率,展示了事件之间的内在联系和影响。原创 2023-04-02 11:23:01 · 1601 阅读 · 0 评论 -
为什么热咖啡保温几小时后的变化比冰咖啡大?
偏高的温度会让我们感受到更丰富多样的香气,但随着温度的变化或者储存过程中咖啡的化学变化,我们感受到的香气也会改变更多。因此,当我们有所期待、有参照物做对比、事先听到一些信息、疲劳或者情绪有变化的时候,都可能会产生主观的感受,这也许是没有那么客观的,但对那个人来说,他当下的感受是真实的,但却是已经受到影响了的。温度越高,这些气味也越多。因为处处有化学,而咖啡中的芳香化合物有一千多种,在不同温度下、在不同条件下会发生什么样的变化,我们无法一一检测和观察,不过从几个主要的角度去进行阐述和总结还是有可能的。原创 2023-03-21 15:29:58 · 243 阅读 · 0 评论 -
数据标签治理,为何要使用标签评分?标签评分模型有哪些?标签评分的应用有哪些?
同时,可查看各个标签的具体指标,如使用度维度,可查看各个标签的当前引用次数、分析次数、调用次数,针对具体指标具体分析,满足不同的标签分析场景。标签评分是标签治理的一个重要措施,通过给标签打分,可清晰直观的从各个维度评估标签,掌握标签真实使用情况,进行标签持续优化,助力业务运营。比如我们定义了“活跃度”这个标签,分为“高活跃、中活跃、低活跃度”等,但真实被打上的这个标签的用户,低于70%,还有很大一部分比例是空值,未打上该标签,说明我们制定的标签值规则有漏洞,需要完善。原创 2023-03-20 11:40:29 · 812 阅读 · 1 评论 -
五分钟了解一致性hash算法,为什么负载均衡常用一致性hash实现?
简单的阐述了下一致性hash,任何技术都不会十全十美,一致性Hash算法也是有一些潜在隐患的,如果Hash环上的节点数量非常庞大或者更新频繁时,检索性能会比较低下,而且整个分布式缓存需要一个路由服务来做负载均衡,一旦路由服务挂了,整个缓存也就不可用了,还要考虑做高可用。不过话说回来,只要是能解决问题的都是好技术,有点副作用还是可以忍受的。原创 2023-03-17 16:30:16 · 572 阅读 · 0 评论 -
五分钟了解 HTTP 3.0 为什么不使用TCP协议?QUIC协议是什么?
所以,在HTTP/2中,TCP队头阻塞造成的影响会更大,因为HTTP/2的多路复用技术使得多个请求其实是基于同一个TCP连接的,那如果某一个请求造成了TCP队头阻塞,那么多个请求都会受到影响。尤其是那些比较大型的设备呢?更换起来的成本是巨大的。因为他是基于UDP的,并没有改变UDP协议本身,只是做了一些增强,虽然可以避开中间设备僵化的问题,但是,在推广上面也不是完全没有问题的。而且,除了中间设备之外,操作系统也是一个重要的因素,因为TCP协议需要通过操作系统内核来实现,而操作系统的更新也是非常滞后的。原创 2023-03-16 16:44:17 · 591 阅读 · 0 评论 -
为什么美国加息,会让硅谷银行破产?美联储为什么要加息?
问:为什么美国加息,会导致银行购买的国债资产减值?问:为什么美国加息会导致国债利率上升?能否再具体讲一下?问:能用数字说明一下吗?问:美联储为什么要加息?问:能否使用数字加以说明?原创 2023-03-14 15:49:37 · 1367 阅读 · 0 评论 -
五分钟了解支付、交易、清算、银行等专业名词的含义?
支付的本质就是货币在收付款人之间的转移,那为什么会转移呢,就是因为发生了经济活动有了交易;就如我们口渴了去超市买了一瓶水,这就是经济活动我们使用银行卡“支付工具”在超市的pos机上刷卡完成了支付;这个过程转移的是电子账户货币,也就是我们的银行结算账户里的钱,转移到了商户的银行结算账户所以支付是在经济活动中,依赖于货币(交换媒介),使用支付工具,通过转移货币,实现商品与货币的价值交换,这个过程就是支付的过程。原创 2023-03-10 11:18:28 · 4226 阅读 · 1 评论 -
言简意赅,三分钟了解什么是IaaS,PaaS,SaaS?有何区别?
提供给消费者的服务是对所有计算基础设施的利用,包括处理CPU、内存、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。你可以从头到尾,自己生产披萨,但是这样比较麻烦,需要准备的东西多,因此你决定外包一部分工作,采用他人的服务。但能控制操作系统的选择、存储空间、部署的应用,也有可能获得有限制的网络组件(例如路由器、,防火墙,、负载均衡器等)的控制。也就是说,你要做的就是设计披萨的味道(海鲜披萨或者鸡肉披萨),他人提供平台服务,让你把自己的设计实现。下面这些都属于 PaaS。原创 2023-03-09 11:15:36 · 514 阅读 · 0 评论 -
下一代ERP系统是什么样的呢?什么是智能化ERP系统?AI能改变ERP系统吗?
到了2000年后,随着企业级数据仓库(EDW)和商业智能(BI)技术的成熟,为企业级作业软件增加了数据分析的功能 ,不过由于当时的技术限制,这些以报表为主要形式的分析都是非实时的,而且需要复杂的技术体系来提取、加工和管理数据。”),架构比较复杂,对于大型企业的数字化转型也许是可行的策略,然而对于缺乏自有开发资源的中型企业来说,难以驾驭开发运维的技术工作,所以,用AI来重塑企业解决方案软件才是王道,过去企业系统处理的数据是该系统内封闭的“小数据”,而利用AI改造核心系统,喂进系统里的是大数据。原创 2023-03-08 11:23:25 · 842 阅读 · 0 评论 -
如何理解元数据、数据元、元模型、数据字典、数据模型这五个的关系?如何进行数据治理呢?数据治理该从哪方面入手呢?
请问元数据、数据元、数据字典、数据模型及元模型的区别有哪些呢?这些相似的概念估计会把人饶晕,这里先给出一个图解的例子,然后再对这些概念作详细解读。1、数据元就是“个人所得税记录表”中的字段,比如示例中的“个人所得税金额”,注意,数据元既有描述内容,也是数据的一部分,最小单元而已,图中蓝色虚框包含的部分就是数据元。2、数据模型就是“个人所得税记录表”这张表本身,它是现实世界的一个抽象,见图中黑色虚框包含的部分。3、”个人所得税金额“的元数据是对”个人所得税金额“这个字段的描述,见图中红色虚框部分,可见它不包含原创 2023-03-07 16:32:41 · 3782 阅读 · 4 评论 -
为什么越来越多的人喜欢拍照呢?如何用手机拍出大片?最受欢迎的摄影主题是什么呢?
春光明媚,万物复苏,全国各地都迎来了报复性出游。花田里比花更多的,是钻研拍照打卡角度、摆出各种姿势的摄影选手。坐着轮椅的老人、举着丝巾的阿姨、穿着汉服的大学生,人人都想用影像留下生命中的美好记忆。在这场“民间摄影大赛”里,既有拿着二手胶片相机、CCD 卡片机的复古派,也有长枪大炮的专业相机党,但大多数人还是靠手机完成摄影。在这个照片和视频的拍摄变得易如反掌的时代,影像创作正在变得越来越普及。每个人都是记录者,手机里的相册就是一部个人传记。从低像素的翻盖机到如今高清摄像的智能机,这部传记的内容原创 2023-03-07 10:46:31 · 360 阅读 · 0 评论 -
什么是“奥卡姆剃刀”,如何用“奥卡姆剃刀”解决复杂问题?复杂问题简单化
在公元 14 世纪左右,有一个来自奥卡姆的威廉,对当时关于「本质」之类的争吵感到厌倦,于是提出了「奥卡姆剃刀」定律。「奥卡姆剃刀」定律的核心思想可以简单概括为 8 个字:「如无必要,勿增实体也就是说,砍掉那些无用的细枝末节,把复杂的问题简单化,所以,我们也称之为「简约法则」。奥卡姆的这把「剃刀」出鞘之后,产生了非常广泛、丰富而且深刻的影响。随着经济社会的发展,有很多问题正在变得越来越复杂,数据和文件变得越来越多,制度和规则变得越来越繁琐,奥卡姆这把闪闪发光的剃刀,正在向更多的领域发起挑战。原创 2023-02-28 11:30:30 · 1203 阅读 · 0 评论 -
什么是数据埋点?有何作用?
数据埋点是指基于业务需求(如淘宝双 11 促销页面统计每个 banner 的点击 次数)、产品需求(如推荐系统统计推荐商品的曝光次数及点击人数),对每一个用户行为事件对应的位置进行埋点,并通过 SDK 上报埋点的数据结果,将记录数据汇总后进行分析,以推动产品优化或指导运营。原创 2022-11-05 10:19:31 · 4672 阅读 · 0 评论 -
一网统管是什么?管什么,怎么管?通俗易懂
何为“一网统管”?简言之,搭建一网平台,统筹管理事务,即“建一网,统筹管”,用实时在线数据和各类智能方法,及时精准地发现问题、对接需求、研判形势、预防风险,在最低层级、最早时间,以相对最小成本,解决最突出问题,取得最佳综合效应,实现线上线下协同高效处置一件事。原创 2022-10-24 17:06:13 · 6654 阅读 · 0 评论 -
【数仓建模】传统建模与宽表建模有何差异?基于宽表建模实践
互联网企业往往存在多个产品线,每天源源不断产出大量数据,这些数据服务于数据分析师、业务上的产品经理、运营、数据开发人员等各角色。为了满足这些角色的各种需求,业界传统数仓常采用的是经典分层模型的数仓架构,从逐层建模,重点支持,如下图:互联网产品快速迭代,业务发展越来越快,跨业务分析越来越多,数据驱动业务越来越重要。数据服务的主要群体正在从数据研发转向产品人员,使用门槛需要进一步降低。面临着如下问题,如下图:那么在生产实践中如何解决上述面临的问题及痛点呢,在对业务线进行调研和对具体用户访谈后,根据调研和访谈原创 2022-06-20 10:33:16 · 630 阅读 · 0 评论 -
GPU的发展史,GPU与CPU的关系是什么?为何现在GPU越来越重要?
2016年,发生了一件震动IT界的大事。谷歌的人工智能软件阿尔法狗(AlphaGo)击败了韩国的世界围棋冠军九段选手李世石。2017年,阿尔法狗又击败了当年世界围棋排名第一的中国围棋九段选手柯洁。至此,人类在所有的棋类比赛中全部输给了计算机。阿尔法狗是一个中央处理器()和图形处理器()一起工作的围棋智能机器人。阿尔法狗以神经网络、深度学习、蒙特卡洛树搜索法为核心算法。其系统由四部分组成:策略网络(),以当前局面为输入,预测下一步的走法;快速走子(),目标和策略网络相似,在适当牺牲质量的条件下的加速走法;价值原创 2022-06-17 11:33:44 · 3473 阅读 · 0 评论 -
大数定律是什么?为何人们更愿意相信从大数据中得到的统计结果,而不是从小数据中得到的经验呢?
在一些情况下,概率是由频率推导而来的,要得到可信的概率,就要大量重复地试验。而且,重复试验的次数越多,结论就越让人信服。那么,为何人们直觉上更愿意相信从大数据中得到的统计结果,而不是从小数据中得到的经验呢?要解释这一现象,统计学中有一个非常重要的理论——大数定律。该定律表明,样本数量越多,结论就越接近真实的概率分布。也就是说,在重复的试验中,随着试验次数不断增加,事件发生的频率会越来越趋于一个稳定的数值,即它的概率。大数定律最早是由数学家伯努利在他的《推测术》中提出的。该书由4个部分组成,前3部分主要是对古原创 2022-06-09 10:09:07 · 1998 阅读 · 1 评论 -
一文细数100+个数据分析指标
这一、用户数据指标IP(Internet Protocol):独立IP数。UV(Unique Visitor):独立访问客数。PV(Page View):页面浏览量/阅读量。VV(Visit View):访问次数。一、用户数据指标IP(Internet Protocol):独立IP数。UV(Unique Visitor):独立访问客数。PV(Page View):页面浏览量/阅读量。VV(Visit View):访问次数。...原创 2022-05-30 16:52:25 · 1164 阅读 · 0 评论 -
【云原生】传统DevOps和云原生DevOps有什么区别?
【云原生】传统DevOps和云原生DevOps有什么区别?导读DevOps的发展史1. 瀑布式开发——>敏捷开发2. 敏捷开发——>DevOps3. 实行DevOps的优势什么是云原生DevOps传统DevOps云原生DevOps那究竟什么是云原生DevOps呢?参考:《PaaS DevOps 微服务》、阿里云原生导读云原生的四大基石大家都应该知道吧,就是容器、微服务、持续交付、DevOps其实博主公司的一些应用就是部署到K8S上,基本上用到了云原生相关的技术,之前和公司同事聊过一原创 2022-05-30 11:17:44 · 1035 阅读 · 0 评论 -
快速了解元宇宙的 7 层产业链
快速了解元宇宙的 7 层产业链01 体验层——映射现实世界的生活场景02 发现层——内容消费的关键领域03 创作者经济层——共享及共创04 空间计算层——实现无边界的关键技术05 去中心化层——元宇宙时代的生态系统核心06 人机交互层——高沉浸感的技术核心07 基础设施层——元宇宙世界中的基础设施参考:《元宇宙:概念、技术及生态》01 体验层——映射现实世界的生活场景元宇宙中的体验并不是打造简单的立体空间中的沉浸感,它可以把人类生活场景的方方面面映射进数字世界。当物理世界数字化之后,体验可以变得原创 2022-05-26 17:13:24 · 1422 阅读 · 0 评论 -
Web3.0和元宇宙之间有什么联系?为什么说Web3.0是基础?
Web3.0和元宇宙之间有什么联系?为什么说Web3.0是基础?01 Web的三次技术迭代1. Web 1.0时代2. Web 2.0时代3. Web 3.0时代02 Web3.0 和 元宇宙1. 去中心化2. AI及3D技术3. 创作者经济01 Web的三次技术迭代Web 3.0 通过新技术体现出来,例如加密货币、虚拟和增强现实、人工智能等。在新技术的推动下,Web 3.0是关于创建一个为人们服务、为人民所有的互联网以太坊带来的商业创新浪潮远远超出了已经在以太坊上产生重大影响的无数行业。如果成功,这原创 2022-05-09 11:03:51 · 3737 阅读 · 0 评论 -
言简意赅,盘点知识图谱在各领域的应用
言简意赅,盘点知识图谱在各领域的应用01 语义匹配02 搜索推荐03 问答对话04 推理决策05 区块链协作什么是知识图谱?通俗易懂01 语义匹配语义匹配是搜索推荐、智能问答和辅助决策的基础。在没有知识图谱以前,文本匹配主要依靠字面匹配为主,通过数据库搜索来获取匹配结果。但这种做法存在两个问题,一方面是文本输入本身的局限性造成检索遗漏;另一方面,检索结果的评价缺少可解释性,排序受到质疑,因此往往无法搜到想要的结果。知识图谱的出现有效解决了上述两个问题,一方面通过关键词扩展获得更多输入效果,另一方面通原创 2022-05-06 17:08:58 · 8578 阅读 · 0 评论 -
边缘计算,是在炒概念吗?
边缘计算,是在炒概念吗?01 为什么提出边缘计算02 谁在担任边缘计算的角色1、工业网关2、工控机3、服务器03 边缘计算领域有哪几类公司边缘计算概念刚出来的时候,很多人的第一反应是“这是哪个行业组织或者公司为了拉动市场需求而创造出来的新词汇吧?”边缘计算是什么?边缘计算系统的组成及概念边缘计算有什么作用?为什么会爆发?边缘计算和云计算的区别是什么?关于边缘计算,边缘计算产业联盟对其定义为:在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的分布式开放平台,就近提供边缘智能服务原创 2022-05-05 17:27:55 · 523 阅读 · 0 评论 -
隐私计算或成趋势?政策资本双BUFF
政策扶持+资本入局,隐私计算将成趋势?01 政策扶持02 商业市场前景03 商业研究机构的认同之前介绍了隐私计算是什么?有什么作用?01 政策扶持技术产业的发展离不开政策的扶持。2018年5月生效的《通用数据保护法案》(GDPR)被称为欧盟“史上最严”条例。该法案除了引入巨额的罚款措施之外,还明确了数据保护的技术效果。Google、Facebook等都收到了巨额罚单,多家国际集团公司面临隐私监管机构提起的诉讼。各企业纷纷更新隐私政策,对隐私保护的重视程度达到了史无前例的高度。我国也相继出台了《中华原创 2022-05-05 14:26:20 · 223 阅读 · 0 评论 -
元数据是什么?如何管理元数据?
元数据是什么?如何管理元数据?01 什么是元数据?02 元数据的类型1. 业务元数据2. 技术元数据3. 操作元数据03 元数据管理的目标1. 建立指标解释体系2. 提高数据溯源能力3. 数据质量稽核体系04 元数据管理的技术1. 元数据采集2. 元数据管理3. 元数据应用4. 元数据接口来源:大数据01 什么是元数据?元数据(metadata)是关于数据的组织、数据域及其关系的信息,简言之,元数据就是描述数据的数据。概念总是生涩,下面举几个例子。示例1:歌词中的元数据有一首很多80后耳熟原创 2022-05-04 14:05:52 · 9901 阅读 · 1 评论 -
为什么说下一代存算分离是大数据建设的必然趋势?
为什么说下一代存算分离是大数据建设的必然趋势?前言01 为什么存算分离会成为历史的必然选择?02 为什么向存算分离的下一代演进是大势所趋?来源:大数据前言根据Starburst联合创始人贾斯汀·伯格曼的经验,想要让企业数据架构经得起时间的考验,关键之一就是拥抱存算分离。著名开源数据库TiDB创始人黄东旭在《近十年数据库流行趋势纵览!存储计算分离、ACID 全面回归…》一文中,也将存算分离放在近年数据库流行趋势的第一位。Facebook根据自己的业务需求,研发了一套存算分离的架构来支撑上亿用户原创 2022-04-29 09:57:26 · 891 阅读 · 0 评论 -
智能驾驶大数据是什么?传统车企如何升级?
智能驾驶大数据是什么?传统车企如何升级?一、介绍1. 安全性2. 高效性3. 便捷性二、问题与挑战1. 计算性能2. 存储性能3. 网络通信性能三、前沿研究1. 资源管理与任务卸载2. 典型应用四、小结来源:大数据一、介绍智能驾驶泛指对于交通工具(尤其是汽车)的智能化改造,应用自动驾驶(autonomous driving)以及车联网(Internet of Vehicles,IoV)等技术,使得传统上完全人为控制的机动车辆具备智能处理的能力,包括但不限于智能数据采集、智能分析、智能决策等,而这一原创 2022-04-28 14:54:36 · 1862 阅读 · 0 评论 -
隐私计算是什么?有什么作用?
这01 隐私计算技术的起源02 隐私计算的概念03 隐私计算技术的发展脉络04 隐私计算技术的应用场景1. 金融行业2. 医疗健康行业3. 政务行业来源:大数据01 隐私计算技术的起源假设有两个百万富翁,他们都想知道谁更富有,但他们都想保护好自己的隐私,都不愿意让对方或者任何第三方知道自己真正拥有多少财富。那么,如何在保护好双方隐私的情况下,计算出谁更有钱呢?这是2000年图灵奖得主姚期智院士在1982年提出的“百万富翁”问题。这个烧脑的问题涉及这样一个矛盾,如果想比较两人谁更富有,两人似原创 2022-04-26 14:09:37 · 10763 阅读 · 2 评论 -
那些长期喝咖啡的人,现在都怎么样了?
原创 2022-04-19 10:33:23 · 223 阅读 · 0 评论