陈伦(colby)
码龄9年
关注
提问 私信
  • 博客:89,664
    89,664
    总访问量
  • 41
    原创
  • 1,907,828
    排名
  • 179
    粉丝
  • 1
    铁粉

个人简介:项目经理/数据架构师/资深数据从业者。 熟悉传统数据、互联网数据处理,精通数据仓库方法论、数据迁移、数据处理、数据可视化、数据建模、架构设计、方案设计,曾负责多个数仓项目0到1建设并落地,有PB级数据调优实战经验! 曾获得计算机四级数据库证书、PMP项目管理专业人士证书等。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:重庆市
  • 加入CSDN时间: 2016-07-31
博客简介:

colby_chenlun的博客

查看详细资料
个人成就
  • 获得40次点赞
  • 内容获得38次评论
  • 获得130次收藏
  • 代码片获得350次分享
创作历程
  • 1篇
    2021年
  • 5篇
    2020年
  • 34篇
    2019年
  • 6篇
    2017年
  • 2篇
    2016年
成就勋章
TA的专栏
  • 实时数仓
    2篇
  • 版本管理Git&SVN
    1篇
  • 离线数据仓库
  • 大数据
    2篇
  • Hbase
    2篇
  • elasticsearch
    1篇
  • kibana
    1篇
  • 互联网
    3篇
  • Sqoop
    1篇
  • 算法
    1篇
  • Kettle
    1篇
  • 编程基础
    2篇
  • AIX
    1篇
  • Linux
    6篇
  • Shell
    4篇
  • DB2
    1篇
  • Hadoop
    7篇
  • Python
    14篇
  • SQL
    11篇
  • PowerDesigner
  • Mysql
    6篇
  • Html/Css
    1篇
  • Hadoop Hue Hive
    4篇
  • Redis
    1篇
  • 分布式
    6篇
  • 爬虫
    2篇
  • DataX
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

基于Kafka+SparkStreaming+Hbase的实时数仓案例-计算日活

一、基础工程构建创建父工程pom.xml<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/...
原创
发布博客 2021.08.05 ·
1907 阅读 ·
5 点赞 ·
2 评论 ·
19 收藏

Python操作HDFS封装类,拷贝过去直接用

from hdfs.client import Clientfrom conf.settings import DFS# 关于python操作hdfs的API可以查看官网:# https://hdfscli.readthedocs.io/en/latest/api.html# client = Client(url, root=None, proxy=None, timeout=None, session=None)# client = Client("http://hadoop:500.
原创
发布博客 2020.11.03 ·
552 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

基于HA高可用搭建Hadoop-3.2.1实战搭建之ES-7.7.1+Kibana-7.7.1集群部署

一、安装环境操作系统 CentOS8elasticsearch-7.7.1kibana-7.7.1机器:hadoop102、hadoop103、hadoop104、hadoop105、hadoop106二、安装elasticsearch-7.7.11、上传文件elasticsearch-7.7.1-linux-x86_64.tar.gz、kibana-7.7.1-linux-x86_64.tar.gz到/opt/software目录2、解压到/opt/module[dep.
原创
发布博客 2020.07.03 ·
567 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基于HA高可用搭建-Hadoop-3.2.1实战搭建之Hbase-2.2.5集群部署

版本选择:Hadoop-3.2.1/Hbase-2.2.5一、Zookeeper正常部署[deploy@hadoop102 module]$ zk.sh start二、Hadoop正常部署[deploy@hadoop102 module]$ start-dfs.sh[deploy@hadoop102 module]$ start-yarn.sh三、Hbase上传、解压[deploy@hadoop102 module]$ tar -xzvf hbase-2.2.5-bin.
原创
发布博客 2020.07.03 ·
782 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

安装Hadoop3.2.1,做基准测试的时候报以下错误[2020-05-31 19:16:40.815]Container exited with a non-zero exit code 1. Error file: prelaunch.err.Last 4096 bytes of prelaunch.err :Last 4096 bytes of stderr :错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster[
原创
发布博客 2020.05.31 ·
827 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Container exited with a non-zero exit code 1. Error file: prelaunch.err.org.apache.hadoop.mapreduce.

这两天闲的慌,装了一下新版本的HADOOP 3.2.1,的HA,装好之后,测试wordcount程序时报下面的错误For more detailed output, check the application tracking page: http://hadoop102:8088/cluster/app/application_1590917926429_0002 Then click on links to logs of each attempt.. Failing the applicati
原创
发布博客 2020.05.31 ·
21389 阅读 ·
14 点赞 ·
20 评论 ·
26 收藏

HIVE日期函数总结

select day -- 时间 ,date_add(day,1 - dayofweek(day)) ...
原创
发布博客 2019.09.10 ·
531 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

SKU与SPU概念

SPU = Standard Product Unit (标准产品单位)SPU 是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述 了一个产品的特性。通俗点讲,属性值、特性相同的商品就可以称为一个 SPU。例如:iphone7 就是一个 SPU,与商家,与颜色、款式、套餐都无关。SKU=stock keeping unit(库存量单位)SKU 即库存进出计量...
原创
发布博客 2019.09.08 ·
413 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

电商基本术语B2B C2C B2C C2B O2O F2C B2B2C

B2B--企业对企业:案例:阿里巴巴、慧聪网C2C--个人对个人:案例:淘宝、易趣、瓜子二手车B2C--企业对个人:案例:唯品会、乐蜂网C2B--个人对企业:案例:海尔商城、尚品宅配O2O--线上到线下:案例:美团、饿了吗F2C--工厂到个人:从厂商到消费者的电子商务模式B2B2C -企业-企业-个人:案例:京东商城、天猫商城...
原创
发布博客 2019.09.08 ·
1449 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

django模型中auto_now与auto_now_add的区别

auto_nowauto_now无论是你添加还是修改对象,时间为你添加或者修改的时间,一般用作更新时间。auto_now_addauto_now_add为添加时的时间,更新对象时不会有变动,一般用作创建时间。具体案例:class BaseModel(models.Model): '''模型抽象类型''' create_time = models.DateTim...
原创
发布博客 2019.09.08 ·
770 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

ODPS之合并与拆分-Lateral View

Lateral View更新时间:2019-02-13 11:56:02编辑··我的收藏本页目录单个Lateral View语句 多个Lateral View语句Lateral View和split,explode等UDTF一起使用,它能够将一行数据拆成多行数据,并在此基础上对拆分后的数据进行聚合。单个Lateral View语句语法定义如下:latera...
转载
发布博客 2019.09.06 ·
5256 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

ubuntu 卸载python3.5

1.卸载python3.5sudo apt-get remove python3.52.卸载python3.5以及它的依赖包sudo apt-get remove --auto-remove python3.53.清除python3.5要想清除python3.5的配置文件和数据文件,执行以下命令:sudo apt-get purge python3.5sudo ...
原创
发布博客 2019.09.06 ·
4961 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

最简单的大数据平台架构

原创
发布博客 2019.09.06 ·
431 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive留存计算

准备表CREATE EXTERNAL TABLE ods_app_log ( sdk_ver string ,time_zone string ,commit_id string ,commit_time string ,pid string ,app_token string ,app_id string ,device_id...
原创
发布博客 2019.09.06 ·
1055 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Sqoop实战案例总结

安装注意事项#Set path to where bin/hadoop is availableexport HADOOP_COMMON_HOME=/app/bigdata/hadoop#Set path to where hadoop-*-core.jar is availableexport HADOOP_MAPRED_HOME=/app/bigdata/hadoop ...
原创
发布博客 2019.09.06 ·
566 阅读 ·
0 点赞 ·
2 评论 ·
2 收藏

Hive之UDF实现

Java实现UDF函数一、实现字符串到数字的转换package com.easyrong.data.function;import org.apache.hadoop.hive.ql.exec.UDF;public class NumberToChar extends UDF{ public static int byteToInt(byte b) { //...
原创
发布博客 2019.09.06 ·
880 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python封装mysql操作方法

class DBTool(object): conn = None cursor = None def __init__(self, conn_dict): self.conn = pymysql.connect(host=source['host'], port=source['p...
原创
发布博客 2019.09.05 ·
366 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Shell实现Hive表结构全备份

登录hive服务器,新建一个shell脚本,内容如下#!/bin/bash#原样输出一段文字可以用CATcat<<EOF****************************************************功能 :实现Hive表结构备份参数 :P1,P2,P3...创建者 :XXXX创建日期 :YYYY-MM-DD修改...
原创
发布博客 2019.09.05 ·
630 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive-ORC文件存储格式

Hive-ORC文件存储格式转自:http://www.lai18.com/content/24596525.html?from=cancelORC文件格式是从Hive-0.11版本开始的。关于ORC文件格式的官方文档,以及基于官方文档的翻译内容这里就不赘述了,有兴趣的可以仔细研究了解一下。本文接下来根据论文《Major Technical Advancements in Apache H...
转载
发布博客 2019.09.04 ·
408 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

排序算法整合(冒泡,快速,希尔,拓扑,归并)

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/onceing/article/details/99838520冒泡排序介绍冒泡排序(Bubble Sort),又被称为气泡排序或泡沫排序。它是一种较简单的排序算法。它会遍历若干次要排序的数列,每次遍历时,它都会从前往后依次...
转载
发布博客 2019.08.29 ·
182 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多