rolin-刘瑞
码龄12年
求更新 关注
提问 私信
  • 博客:4,401,249
    社区:1,973
    动态:55
    4,403,277
    总访问量
  • 146
    原创
  • 475
    粉丝
  • 11
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2013-05-12

个人简介:技术GEEK

博客简介:

大数据训练营

博客描述:
大数据训练营
查看详细资料
个人成就
  • 获得374次点赞
  • 内容获得106次评论
  • 获得1,534次收藏
  • 代码片获得207次分享
创作历程
  • 9篇
    2022年
  • 5篇
    2021年
  • 2篇
    2020年
  • 26篇
    2019年
  • 53篇
    2018年
  • 137篇
    2017年
  • 31篇
    2016年
  • 53篇
    2015年
  • 124篇
    2014年
  • 8篇
    2013年
成就勋章
TA的专栏
  • 大数据体系干货
    1篇
  • 推荐系统系列
    3篇
  • 大数据生态搭建系列
    7篇
  • Redis系列
  • ORACLE数据库
    1篇
  • asp.net
    4篇
  • c#
    3篇
  • java
    24篇
  • sqlserver2008
    1篇
  • javascript
    5篇
  • 打印机
    1篇
  • jQuery
    1篇
  • web前端技术
    2篇
  • 服务器软件
    2篇
  • tomcat
    1篇
  • jboss
    1篇
  • weblogic
    1篇
  • android
    1篇
  • 游戏开发
    1篇
  • IIS
    1篇
  • web服务器
    2篇
  • ajax
    1篇
  • .net控件
    1篇
  • hive
    39篇
  • 聚类算法
    4篇
  • 数据挖掘
    19篇
  • mahout
    2篇
  • ambari
    2篇
  • hadoop
    44篇
  • mapreduce
    8篇
  • mapreduce表关联
    1篇
  • linux
    30篇
  • spark
    16篇
  • maven
    5篇
  • 数据结构
    1篇
  • c
    2篇
  • 设计模式
    2篇
  • hbase
    18篇
  • mysql
    9篇
  • 分布式缓存
    1篇
  • 进程通讯
    1篇
  • flume
    10篇
  • kafka
    12篇
  • storm
    4篇
  • hadoop监控
    1篇
  • ganglia
    1篇
  • jvm
    20篇
  • 经验
    1篇
  • python
    9篇
  • scala
    3篇
  • 推荐系统
    10篇
  • 网络
    1篇
  • java异常大全
    9篇
  • 大数据异常大全
    1篇
  • eclipse
    2篇
  • java spring 注解
    1篇
  • mysql mysql表
  • mysql mysql表复制 表快速复制
    1篇
  • 开发工具
    1篇
  • webmagic
    1篇
  • 算法
    7篇
  • 广告平台
    1篇
  • 实用工具
  • ubuntu
    1篇
  • 数据库
    1篇
  • redis
    3篇
  • mac
    2篇
  • m
  • 游戏运营
    1篇
  • django
    2篇
  • quartz
    2篇
  • hado
  • php
    1篇
  • nginx
    1篇
  • zookeeper
    4篇
  • mongodb
    1篇
  • virtualbox
    1篇
  • 架构
    6篇
  • 大数据
    4篇
  • 架构师
    4篇
  • 用户画像
    1篇
  • scrapy
  • 神经网络
    1篇
  • r语言
    1篇
  • spark streaming
    9篇
  • bigdata
    1篇
  • Elasticsearch
    7篇
  • markdown
    1篇
  • 序列化
  • protobuf
    1篇
  • shell
    2篇
  • 人脸识别
  • 机器学习
    4篇
  • ji
  • 市场买量
  • intellij
    2篇
  • spark mllib
    3篇
  • kiji
  • 实时推荐系统
    5篇
  • s
  • sa
    1篇
  • kylin
    5篇
  • j
  • presto
    1篇
  • OLAP
    4篇
  • 人工智能
    2篇
  • 问答系统
    6篇
  • 情感词分析
    1篇
  • 自然语言处理
    5篇
  • NLTK
    3篇
  • 推荐
  • sklearn
    1篇
  • 聊天机器人
    3篇
  • pyth
  • tensorflow
    1篇
  • 深度学习
    2篇
  • dr.elephant
  • 调度i
  • 调度系统
    1篇
  • tez
    2篇
  • 数据仓库
    8篇
  • ignite
    1篇
  • zo
  • yarn
    12篇
  • ha
  • 文字识别
    1篇
  • calcite
    1篇
  • greenplum
  • UML
    2篇
  • 压测
    1篇
  • ReAir
    1篇
  • superset
    1篇
  • druid
    1篇
  • caravel
    1篇
  • r'p'c
  • RPC
    1篇
  • kabana
  • hdfs
    5篇
  • 谓词下推
    1篇
  • shuffle
    1篇
  • 缓存
    1篇
  • canal
    1篇
  • otter
    1篇
  • flink
    2篇
  • stop
    1篇
  • pulsar
    1篇
  • bookkeeper
    1篇
  • datax
    1篇
  • TiDB
    1篇
  • raft
  • antlr

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 1

TA参与的活动 0

兴趣领域 设置
  • 大数据
    hadoophivespark
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

COSO内部控制框架

无论是COSO于1992年发布的首版内部控制框架,还是于2013年再版的内部控制框架,都明确表示企业风险管理框架包含内部控制,如图18-3所示,展现了内部控制、风险管理和公司治理三者的关系。它是将企业内部控制作为企业风险管理的一个子系统。COSO内部控制框架明确指出:有效的内部控制是避免企业经营失败的防线之一。内部控制是提升企业经营绩效的重要驱动力,它能帮助企业管理风险,创造维护企业价值。罗伯特.R.穆勒的著作《COSO内部控制指南》(2013版)将内部控制的主要内容,概括为一个定义、三类目标、五项要素和十
转载
发布博客 2022.12.01 ·
10608 阅读 ·
1 点赞 ·
1 评论 ·
7 收藏

投资人口中的Unit Eco是个什么鬼?一篇文章教会你用数学公式看透商业模式

比如“每日完成总单数/总工时”,这个其实是大多业务中最大的一块变量,而大家一般在讲的故事都是当我客户足够多、密度足够高的时候,我就能节省非常多的路途时间,也就是平均每小时能完成的单数就高了(这也是为什么非常多投资人喜欢强调效率的原因,服务效率有多高是对商业模式是否成立贡献最大的一个点),虽然实际上大家算了半天可能最后发现服务效率最高的还是在店里不动等客人上门,而不是放一个人出去满城市的乱跑。而很遗憾的,基本上所有的O2O公司的这个等式的结果都是小于号,也就是每个人每小时服务创造的收入是不及成本的。
转载
发布博客 2022.12.01 ·
414 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Volcano架构解读:基于Kubernetes的云原生批量计算平台

正确安装部署后,将生成4个组件,分别为:Volcano-admission、Volcano-admission-init、Volcano-controllers、 Volcano-scheduler ,其中admission-init以作业的方式生成证书。defs 是安装时的配置;Volcano是基于Kubernetes的高性能批量计算平台,目前支持几乎所有的主流计算框架,包括MindSpore、TensorFlow、Kubeflow、MPI、PyTorch、飞浆、Spark、HOROVOD 等。
转载
发布博客 2022.10.03 ·
1558 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Data Fabric(数据编织)简介

而数据编织是一种架构思想,跟数据集成本来是无法直接比较的,但由于数据虚拟化是实现数据编织架构中的关键技术之一,因此可以比较下数据虚拟化和数据集成的区别,数据虚拟化可以在不移动数据的情况下从源头访问数据,通过更快、更准确的查询帮助缩短实现业务价值的时间,具体包括跨平台敏捷集成、统一语义、低代码创建数据API(支持SQL、REST、OData和GraphQL等技术)、智能缓存加速等功能,数据虚拟化跟数据集成还是有本质区别的,假如没有虚拟化能力,数据是很难编织起来的,当然,数据编织远远超越了数据虚拟化的范畴。
转载
发布博客 2022.10.02 ·
3712 阅读 ·
4 点赞 ·
0 评论 ·
17 收藏

F1 Query

Google最近在VLDB2018发表了"F1 Query: Declarative Querying at Scale"。SIGMOD2017上发表过一篇论文介绍Spanner的Query Engine。对比去年的遮遮掩掩,今年F1 Query诚意满满。X-DB的定位是一款对标Spanner的分布式HTAP数据库,作为X-DB的Query Engine的开发者,在研读后感慨良多,特此总结。
转载
发布博客 2022.10.02 ·
298 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

HSAP 服务/分析一体化

简介: 大数据的下一站是什么?服务/分析一体化(HSAP)作者:蒋晓伟(量仔) 阿里巴巴研究员因为侧重点的不同,传统的数据库可以分为交易型的 OLTP 系统和分析型的 OLAP 系统。随着互联网的发展,数据量出现了指数型的增长,单机的数据库已经不能满足业务的需求。特别是在分析领域,一个查询就可能需要处理很大一部分甚至全量数据,海量数据带来的压力变得尤为迫切。这促成了过去十多年来以 Hadoop 技术开始的大数据革命,解决了海量数据分析的需求。与此同时,数据库领域也出现了一批分布式数据库产品来应对 OL
转载
发布博客 2022.04.11 ·
433 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

装饰者模式

今天我们来学习一下装饰者模式。作为一名程序猿,相信许多人都跟我一样,在平时写代码的过程中,习惯使用继承。但是继承有时候会出现非常严重的问题,不过,没担心。装饰者模式将会给爱用继承的我们一个全新的设计眼界!一、星巴兹咖啡的故事  我们通过一个生动有趣的例子来引出我们今天的主角--装饰者模式。  1、现在呢,有一个咖啡馆,它有一套自己的订单系统,当顾客来咖啡馆的时候,可以通过订单系统来点自己想要的咖啡。他们原先的设计是这样子的:  2、此时、咖啡馆为了吸引更多的顾客,需要在订单系统.
转载
发布博客 2022.01.29 ·
385 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Prometheus 和 Grafana监控机器

最近在研究如何给应用添加合适的 Metrics,用来分析应用的使用情况以及调试,整体思路是使用 Prometheus 收集数据,Grafana 进行数据的展示。过程中发现了 node-exporter 项目,觉得可以直接拿来监控自己平时使用的 Linux 机器,就有了这篇文章。整个系统使用了三个组件:node-exporter:运行在主机上收集操作系统上各种数据的 Agent,Prometheus 中称为 exporter Prometheus:开源的时序数据库,作为数据存储和分析的中心 Graf
原创
发布博客 2022.01.15 ·
340 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

SLA、SLO 和 SLI

SLA、SLI 和 SLO 是 SRE 工程实践里非常核心的概念,但是大家在同时提到这些概念的时候,经常容易混淆。长篇大论的文章反而容易使人更加疑惑,还不如画一张示意图说明一下,帮助大家一次性彻底梳理清楚这些不可以含糊不清的核心概念。说明一下,下图假设所讨论的 SLA 个数为 1,使用了软件工程中 ER 图的表达方式,但也有所变化。一图讲清 SLA、SLO、SLI本文不讲 why,只是帮助大家梳理清楚这些概念在以上人机系统中的相互关系。虽然不想做名词解释。但是为了方便起见,整理一个术语清单。
转载
发布博客 2022.01.15 ·
952 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MTTR/MTTF/MTBF图解

MTTR/MTTF/MTBF图解MTTR、MTTF、MTBF是体现系统可靠性的重要指标,但是三者容易混淆,下文使用图解方式解释三者之间的区别,希望能起到解惑的效用。MTTF (Mean Time To Failure,平均无故障时间),指系统无故障运行的平均时间,取所有从系统开始正常运行到发生故障之间的时间段的平均值。 MTTF =∑T1/ NMTTR (Mean Time To Repair,平均修复时间),指系统从发生故障到维修结束之间的时间段的平均值。MTTR =∑(T2+T3)/ NM
转载
发布博客 2021.12.21 ·
1115 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

mysql explain 结果字段说明

1、idselect查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序三种情况:(1)id相同,执行顺序由上至下id相同,执行顺序由上至下此例中 先执行where 后的第一条语句 t1.id = t2.id 通过 t1.id 关联 t2.id 。 而 t2.id 的结果建立在 t2.id=t3.id 的基础之上。(2)id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先.
转载
发布博客 2021.07.22 ·
176 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql filesort过程解读

在执行计划中,可能经常看到有Extra列有filesort,这就是使用了文件排序,这当然是不好的,应该优化,但是,了解一下他排序的原理也许很有帮助,下面看一下filesort的过程: 1、根据表的索引或者全表扫描,读取所有满足条件的记录 2、对与每一行,存储一对儿值到缓冲区,一个是排序的索引列的值,即order by用到 的列值,和执向该行数据的行指针,缓冲区的大小为sort_buffer_size大小 3、当缓...
转载
发布博客 2021.07.22 ·
348 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

何谓云原生?

何谓云原生?技术的变革,一定是思想先行,云原生是一种构建和运行应用程序的方法,是一套技术体系和方法论。云原生(CloudNative)是一个组合词,Cloud+Native。Cloud表示应用程序位于云中,而不是传统的数据中心;Native表示应用程序从设计之初即考虑到云的环境,原生为云而设计,在云上以最佳姿势运行,充分利用和发挥云平台的弹性+分布式优势。Pivotal公司的Matt Stine于2013年首次提出云原生(CloudNative)的概念;2015年,云原生刚推广时,Matt St..
原创
发布博客 2021.07.22 ·
384 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

JVM类加载机制

目录总结类加载器自定义类加载器双亲委托模型加载过程详解1、加载2、链接3、初始化总结类从被加载到JVM中开始,到卸载为止,整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载七个阶段。其中类加载过程包括加载、验证、准备、解析和初始化五个阶段。类加载器类加载器的任务就是根据一个类的全限定名来读取此类的二进制字节流到JVM中,然后转换为一个与目标类对应的java.lang.Class对象实例。BootstrapClassLoader、ExtClas
原创
发布博客 2021.04.11 ·
136 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

表达式引擎Aviator

Aviator是一个轻量级、高性能的Java表达式执行引擎, 本文内容主要来自于官方文档更多干货 分布式实战(干货) spring cloud 实战(干货) mybatis 实战(干货) spring boot 实战(干货) React 入门实战(干货) 构建中小型互联网企业架构(干货) python 学习持续更新 ElasticSearch 笔记 kafka storm 实战 (干货) scala 学.
转载
发布博客 2020.06.14 ·
1429 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Apache Kylin 云原生架构的思考及规划

原文地址:https://mp.weixin.qq.com/s/mBLeSlU-IQlYTNe9cOkFVQ各位同学,大家下午好!非常高兴今天来到这个场合,给大家介绍一下 Apache Kylin 在接下来云原生方面的变化和思考,以及我们在这方面最近的工作。01关于 Apache Kylin首先介绍一下 Apache Kylin 这个项目,Kylin 是我们五六年前在 ...
转载
发布博客 2020.03.20 ·
535 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据体系干货(一) - 数据平台与数据中台

目录数据平台数据中台数据平台与数据中台的区别与联系区别联系整体架构硬件层&虚拟化数据平台存储能力计算能力管理平台数据中台数据仓库数据集市数据开发数据运维赋能对象赋能管理者赋能业务运营赋能业务中台赋能数据变现赋能合作伙伴数据平台数据平台是在数以万计的硬件之上建立统一的基础数据存储和计算的服务,当然我们所建设的数据平台需要周边一些辅助的服务来支撑核心服务的运行,以及一些数据平台管理类工具...
原创
发布博客 2019.12.28 ·
4518 阅读 ·
8 点赞 ·
0 评论 ·
36 收藏
加载更多