大数据
主要介绍大数据的相关组件,也是记录自己学习的历程
峰峰的猫
归零心态,持续学习
展开
-
Centos7更换源到安装mysql7远程连接全流程
不浪费时间也是一种进步原创 2020-07-25 13:07:46 · 165 阅读 · 0 评论 -
机组学习笔记之存储器——volatile一词解读CPU“缓存模型”
由单机版“写直达和写会”到分布式的缓存一致性原创 2020-07-05 11:02:52 · 242 阅读 · 0 评论 -
机组学习笔记之——性能与功耗分析
揭秘性能优化的三条康庄大道...原创 2020-07-01 22:46:10 · 464 阅读 · 0 评论 -
scala学习笔记之——主构造器,辅助构造器
因为scala底层也是基于jvm,并且来源于java,是纯粹的“面向对象”的语言。java在基本数据类型,null还有静态类不是面向对象;所以这里我们先回顾下java构造器的特点:1 在java中一个类可以定义多个不同的构造方法,构造方法重载2 如果程序员没有定义构造方法,系统会自动给类生成一个默认无参构造方法,比如Person(){}3 一旦定义了自己的构造方法,默认的构造方法就覆盖了,既不能再使用默认的无参构造器,除非显示的定义一下,Person(){}与java类似,scala同样可以由原创 2020-06-30 20:28:34 · 258 阅读 · 0 评论 -
README-必看!
我想做什么?我是一枚19年毕业的程序猿,由AI入坑IT行业。做了一年CV之后发现自己不太适合做研究类的岗位(其实是怕本科学历以后AI发展受限)。现打算一步步转 数据挖掘岗位,懂算法会开发这样的一个角色。自己学习东西喜欢尽可能全面,深入的学习。自己写博客的原因是保证自己的输出,同时也希望能与经历相似的小伙伴更多的交流。打算每学习一项技术都做一个系列的博客更新。其中会包括MySQL,hadoop,spark数据开发组件以及逻辑回归,svm,XGBOOST等算法模块;打算在数据和模型这块深挖下去;也希望有志同道原创 2020-06-03 09:11:22 · 424 阅读 · 0 评论 -
MySQL之表设计——三范式+ER图
数据库中建立的表是对现实世界的数据构建的“数据模型”;建立现实世界到机器世界的一个桥梁这样的作用,在一定的理论基础上建立表能够降低“数据的冗余”,查询请求更加的高效;基础理论降低表冗余的“三范式”清晰描述“实例”与“关系”的ER图...原创 2020-05-20 11:13:53 · 1256 阅读 · 0 评论 -
mysql之数据存储模块——B+树系列
为什么要有B+树?总的来说B+树也是树的一个分支,属于自平衡树,用来存储数据。数据就离不开“增删改查”操作。关于自平衡树,我们有AVL树,红黑树等。他们都是基于“数据位于内存”这样的前提下构建的算法。当面临海量数据时,这些算法将不再适用。并且数据量急剧增多,树的高度增加造成查找时间复杂度O(log(h))也会很大。基于内存的自平衡树存在的问题:1.不适用海量数据2.单个节点存储数据少,导致树的深度过深。查询效率慢。B+树采用磁盘预读和多叉树的形式解决!B树的基本概念1.所有的叶子结点都原创 2020-05-18 17:30:39 · 551 阅读 · 0 评论