自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 大数据应用之用户画像的流程、方法详解

Persona就是最早对用户画像的定义,随着时代的发展,用户画像早已不再局限于早期的这些维度,但用户画像的核心依然是真实用户的虚拟化表示。在大数据领域,用户画像的作用远不止于此。由这些标签集合能抽象出一个用户的信息全貌,如图10-1所示是某个用户的标签集合,每个标签分别描述了该用户的一个维度,各个维度相互联系,共同构成对用户的一个整体描述。为了保证兴趣画像既有一定的准确性又有较好的泛化性,我们会构建层次化的兴趣标签体系,其中同时用几个粒度的标签去匹配用户兴趣,既保证了标签的准确性,又保证了标签的泛化性。

2023-05-03 04:57:51 3809 1

原创 彻底搞懂三大MySQL日志,Redo Log、Undo Log、Bin Log

并在事务中读取的时候生成一个ReadView(读视图),在Read Committed隔离级别下,每次读取都会生成一个读视图,而在Repeatable Read隔离级别下,只会在第一次读取时生成一个读视图。MySQL实现事务、崩溃恢复、集群的主从复制,底层都离不开日志,所以日志是MySQL的精华所在。这就是二阶段提交的概念,先写处于prepare状态的Redo Log,事务提交后,再写处于commit状态的Redo Log。记录的是逻辑日志,即原始的SQL语句,是MySQL自带的。直接持久化到磁盘不好吗?

2023-05-03 04:29:33 260

原创 数据中台到底是什么?

不是一套系统,也不是一套产品,而是一种机制。在传统IT架构中,不同部门,不同业务系统和不同的数据中心会产生大量数据。这些数据如果烟囱一样是垂直划分的,彼此之间无法连接,我们也把这种数据叫。分散在各个孤岛上的数据彼此独立,无法很好的支撑企业的经营决策,也无法很好地应对快速变化的前端业务。因此,我们需要一套机制,利用这一套机制整合这些分散在各个孤岛上的数据,为企业经营决策、精细化运营提供支撑,这套机制就是数据中台。

2023-05-03 04:20:42 390

原创 编程除了学语言还要学什么?

无论是出于哪个阶段的同学,都要了解程序是什么,计算机的组成原理是什么,推荐数据《深入理解计算机系统》,学习这本书,你会对计算机底层世界有一个宏观的认知,搞清楚计算机底层工作原理,为什么它可以完成如此复杂的工作?学会编程语言只能说明你会用这个语言,但是想要用这门语言区处理具体的事情,那就需要学好算法,因为不管你是java爱好者或者python粉丝,亦或者觉得PHP是世界上最好的语言,甚至是数据库DBA,要深入理解你的工具,都绕不过算法这个门槛。也就是编译器的原则、技术和工具,中文版名字叫《编译原理》。

2023-05-03 04:03:33 120

原创 CentOS7—Linux安装MySQL教程

mysql在centos上安装流程

2023-05-03 03:37:23 95 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除