时光带不走丶年少轻狂
码龄5年
关注
提问 私信
  • 博客:41,388
    社区:789
    动态:7
    42,184
    总访问量
  • 26
    原创
  • 70,346
    排名
  • 83
    粉丝
  • 0
    铁粉

个人简介:只争朝夕,不负韶华

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2020-02-23
博客简介:

时光带不走,年少轻狂

博客描述:
行走的IT码仔
查看详细资料
  • 原力等级
    当前等级
    2
    当前总分
    132
    当月
    1
个人成就
  • 获得147次点赞
  • 内容获得12次评论
  • 获得220次收藏
  • 代码片获得165次分享
创作历程
  • 6篇
    2024年
  • 2篇
    2022年
  • 2篇
    2021年
  • 16篇
    2020年
成就勋章
TA的专栏
  • SQL
    4篇
  • linux
    9篇
  • 大数据
    11篇
  • kafka
    1篇
  • spark
兴趣领域 设置
  • 大数据
    hadoophivestormsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

数据域的划分

按照数据用途划分:根据数据的用途或应用场景,将数据划分为不同的数据域。例如,可以划分为分析域(用于数据分析、挖掘和预测等)、运营域(用于企业日常运营和管理等)和监管域(用于政府监管、合规性检查等)。按照数据来源划分:根据数据的来源或产生渠道,将数据划分为不同的数据域。例如,可以划分为内部数据域(如企业内部的ERP系统、CRM系统等产生的数据)和外部数据域(如市场调研数据、社交媒体数据等)。增强数据安全性:通过数据域划分,可以对不同领域的数据进行权限控制,确保数据的安全性和隐私性。四、数据域划分的注意事项。
原创
发布博客 2024.10.15 ·
439 阅读 ·
10 点赞 ·
0 评论 ·
5 收藏

离线数仓分层理论知识

离线数仓
原创
发布博客 2024.10.15 ·
672 阅读 ·
25 点赞 ·
0 评论 ·
7 收藏

一篇文章搞懂MYSQL常用命令

一篇文章搞懂mysql常用命令
原创
发布博客 2024.07.04 ·
1831 阅读 ·
49 点赞 ·
0 评论 ·
34 收藏

经典SQL面试题

sql面试题注册用户数,注册用户数下单量
原创
发布博客 2024.07.04 ·
148 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

经典SQL面试题查询比前一天温度高的日期

【代码】经典SQL面试题查询比前一天温度高的日期。
原创
发布博客 2024.06.25 ·
214 阅读 ·
3 点赞 ·
1 评论 ·
0 收藏

经典SQL面试题连续登录问题

面试题,连续登录问题
原创
发布博客 2024.06.25 ·
896 阅读 ·
9 点赞 ·
0 评论 ·
2 收藏

数据仓库理论知识

数据仓库理论知识为什么要分层分层的主要原因是在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个原因:清晰数据结构:每一个数据分层都有它的作用域,这样我们在使用表的时候能更方便地定位和理解。数据血缘追踪:简单来说,我们最终给业务呈现的是一个能直接使用业务表,但是它的来源有很多,如果有一张来源表出问题了,我们希望能够快速准确地定位到问题,并清楚它的危害范围。减少重复开发:规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算。把复杂问题简单化:将一个复杂的任务分
原创
发布博客 2022.03.15 ·
272 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据仓库维度模型设计

**数据仓库维度模型设计**维度建模基本概念维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工具箱》,是数据仓库工程领域最流行的数仓建模经典。维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。维度建模是专门应用于分析型数据库 数据仓库 数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。事实表发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中。从
原创
发布博客 2022.03.15 ·
378 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

centos7 集群时间同步

centos7集群时间同步安装NTPyum install ntp ntpdate -y修改配置文件vim /etc/ntp.confserver 0.centos.pool.ntp.org iburst server 1.centos.pool.ntp.org iburstserver 2.centos.pool.ntp.org iburstserver 3.centos.pool.ntp.org iburst改为#server 0.centos.pool.ntp.org ib
原创
发布博客 2021.03.13 ·
358 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

CDH6离线安装步骤遇到问题及解决方案

centos7 安装CDH6集群环境安装包准备centos7安装包下载使用VMware虚拟机安装centos7克隆虚拟机(至少克隆三台虚拟机) 我的配置(4G内存 8和处理器 100G 硬盘)下载cdh包下载地址:​ https://archive.cloudera.com/cdh6/6.2.1/parcels/​ https://archive.cloudera.com/cm6/6.2.1/redhat7/yum/RPMS/x86_64/[外链图片转存失败,源站可能有防盗链机制,建议将图
原创
发布博客 2021.03.12 ·
2262 阅读 ·
18 点赞 ·
0 评论 ·
12 收藏

hive行列转换函数使用示例

hive 行列转换函数行转列 多行合并为一列使用函数:concat_ws(‘,’,collect_set(column))collect_list 不去重collect_set 去重column 的数据类型要求是 string示例:构建测试数据vim row_to_col.txta b 1a b 2a b 3c d 4c d 5c d 6 建表create table tabname(col1 String,col2 String,col3 stirng
原创
发布博客 2020.12.04 ·
764 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive常用函数归纳总结

Hive 常用函数一, 关系运算符等值比较: =语法: A=B操作类型: 所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE; 否则为FALSEhive> select 1 from tabname where 1=1不等值比较: <>语法: A<>B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL, 返回NULL;如果表达式A与B不相等, 则为TRUE; 否则为FALSEhive> select 1 fro
原创
发布博客 2020.12.04 ·
206 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

省市区三级联动数据库资源

发布资源 2020.12.01 ·
sql

kafka入门基础命令

kafka启动命令./bin/kafka-server-start.sh(启动命令) -daemon(后台启动参数) config/server.properties (配置文件)kafka语法查看主题个数 命令 ./bin/kafka-topics.sh --list --zookeeper Hadoop01:2181创建主题 命令 ./bin/kafka-topics.sh --create --zookeeper Hadoop01:2181 --topic first.
原创
发布博客 2020.11.26 ·
148 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

superset安装及简单使用

SupersetBI VS 报表工具报表工具是数据展示工具,而BI(商业智能)是数据分析工具。报表工具可以制作各类数据报表、图形报表的工具,甚至还可以制作电子发票联、流程单、收据等。BI可以将数据进行模型构建,制作成Dashboard,相比于报表,侧重点在于分析,操作简单、数据处理量大。常常基于企业搭建的数据平台,连接数据仓库进行分析。简介Superset是一款开源的现代化企业级BI。它是目前开源的数据分析和可视化工具中比较好用的,功能简单但可以满足我们对数据的基本需求,支持多种数据源
原创
发布博客 2020.11.23 ·
28375 阅读 ·
24 点赞 ·
11 评论 ·
150 收藏

Spark Local模式安装

Spark Local模式安装如何安装步骤:1-准备好已经编译好的spark的软件包2-上传到Linux中,对应目录3-解压对应压缩包tar -zxvf spark.tar.gz -C /export/servers4-配置环境变量当前local环境下仅仅需要配置conf/spark-env.shcp spark-env.sh.template spa...
原创
发布博客 2020.03.30 ·
260 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

挂载硬盘操作文档

挂载新的硬盘操作1,1目标给虚拟机增加一块硬盘1.2 路径1,了解 Linux系统分区的原理2,查看系统分区情况3, 虚拟机增加硬盘4, 建立分区5, 格式化分区6, 挂在映射分区7, 设置重启后挂载不失效1.3实现1, 一个硬盘可以分成多个分区用户不能直接操作硬件,需要让硬件和系统的目录建立映射关系 ,这个操作称为挂载2 , 查看系统分区挂载情况# 查看所有设备的...
原创
发布博客 2020.03.13 ·
213 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多