自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 BI报表开发

BI报表开发,FineReport

2024-06-18 20:08:22 1007 1

原创 Python报表需求处理示例

Python报表开发代替手工Excel操作。

2024-06-11 21:01:40 268 1

原创 大数据面试题第二期*6

序列化就是把内存中的对象,转换成字节序列。

2024-06-07 19:24:55 404 1

原创 Python数据分析II

数据分析突破,包含绘图!

2024-06-07 17:46:22 700 1

原创 Python数据分析I

python数据分析汇总(更新),更完整的函数属性知识点体系,愿为初学者再添一份力😊!

2024-06-07 11:19:15 2166

原创 Python数据分析

python数据分析,Anaconda在pycharm中的应用

2024-06-05 15:59:21 611 1

原创 python方法

Python应用,公共方法及函数,结合前两节容器概念

2024-06-05 15:38:51 462 1

原创 Python容器(下)

python容器,python知识点汇总!

2024-06-05 15:11:16 620

原创 Python容器(上)

python容器,python知识点汇总!

2024-06-05 15:04:01 959

原创 Python进阶

python进阶,python知识点汇总!

2024-06-05 14:38:02 317

原创 Python基础

python基础,python知识点汇总!

2024-06-05 14:07:18 451

原创 大数据面试题第一期*4

大数据面试题第一期(4篇)

2024-05-11 19:56:51 647 1

原创 Hive优化方案

Hive的优化方案(可用于面试)

2024-05-10 19:41:13 816

原创 Pytharm2020安装详细教程

pytharm安装教程详解

2024-05-08 21:28:10 472

原创 Python解释器3.8.2版本安装详细教程

python解释器安装教程

2024-05-08 20:55:50 689

原创 Hive大数据任务调度和业务介绍

ZooKeeper和DolphinScheduler的使用

2024-05-04 19:25:36 2215 1

原创 数据仓库设计

数据仓库sql开发,hiveSQL

2024-04-29 21:04:54 702

原创 DataX数据采集流程(项目)

dataX数据采集

2024-04-26 17:52:12 840 3

原创 大数据项目介绍

大数据实战项目

2024-04-25 21:47:11 886 1

原创 Pl/sql+存储函数

存储函数,自定义函数,可直接调用或供他人调用

2024-04-24 19:49:02 772 1

原创 PLSQL数据库

plSQL数据库基本语法

2024-04-22 20:24:51 2337 2

原创 Oracle数据库(虚拟机包在评论区)

(1)ORACLE 数据库系统是美国 ORACLE 公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或B/S 体系结构的数据库之一。(2)ORACLE 通常应用于大型系统的数据库产品。(3)ORACLE 数据库是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。

2024-04-18 15:38:38 673 2

原创 Hive进阶

ELT是将etl的开发流程进行了调整,使用采集工具采集数据,将数据直接写入hdfs,清洗转化过程可以使用hiveSQL在数仓中执行。资源全部给一个计算任务使用,但是当计算任务中的某个map或reduce计算完成后,可以将自身资源释放掉给其他计算任务使用。2-split切割后的数据传递给对应的map进行处理,会对数据转为kv (张三,1) (张三,1),(李四,1)随着分析需求的改变,数仓中的数据也在不断变化,随着时间推移,统计的字段计算数据也在发生变化。reduce的个数默认是一个;

2024-04-15 18:13:48 1163 1

原创 分布式文件存储系统

分布式文件存储系统

2024-04-14 19:27:50 910 1

原创 Hive数据库的分区与分桶

多表关联,为了提升多表关联的查询效率,可以将关联的表数据按照相同的关联字段,进行分桶,保持分桶个数一致,或是倍数关系,可以将系统数据放在同一个余数文件中,提升了关联效率。) -- clustered by 指定按照哪个字段的数据进行数据的拆分 into 2 buckets 指定拆分的数量。) -- clustered by 指定按照哪个字段的数据进行数据的拆分 into 2 buckets 指定拆分的数量。大数据开发数据量较大,在进行数据查询计算时,需要对数据进行拆分,提升的查询速度。

2024-04-10 20:29:50 832 1

原创 Hive数据库项目搭建

重要。

2024-04-07 21:20:21 989 2

原创 MapReduce与Yarn的概述

mapreduce、yarn概述

2024-04-03 16:33:34 826 1

原创 Hadoop概述,及虚拟机集群搭建详解

Hadoop概述了解,虚拟机集群搭建过程

2024-04-01 12:08:44 762

原创 Linux全集(包含第一节所有章节)

more 文件 :局部查看(enter 向下一行;space 向下一页;date -d '数值 时间单位' +'%Y-%m-%d %H:%M:%S' :时间加减格式化输出。date -d '数值 时间单位':时间加减 (例:date -d '1 year')date +'%Y-%m-%d %H:%M:%S' :时间格式化(按照自定义格式输出)find 目录路径 -size -10k:按照文件大小查找(路径下小于10k的文件)mkdir -p 路径 (mkdir -p ./路径) :指定路径下创建多级目录。

2024-04-01 08:22:10 514

原创 MySqL-常用语句汇总(包含前三章章节)

与聚合函数合并:select 列,[聚合结果] from 表 where 条件 group by 分组条件列 order by 条件(age) (Asc升/Desc降);select 列,[聚合结果] from 表 where 条件 group by 分组条件列 order by 条件(age) (Asc升/Desc降);最大max(······),最小min(······),平均avg(······),计数count(······),求和sum(······)。

2024-03-22 21:58:54 919 1

原创 数据库—进阶语句必备

与聚合函数合并:select 列,[聚合结果] from 表 where 条件 group by 分组条件列 order by 条件(age) (Asc升/Desc降);种类:最大max(······),最小min(······),平均avg(······),计数count(······),求和sum(······)二级排序:select 列 from 表 [where] order by 条件(1) Asc , 条件(2) Asc;

2024-03-19 19:23:21 551

原创 数据库-基本语句必备

INSERT INTO student(id, name) VALUE (2, '小芳');UPDATE student SET gender = '女' WHERE id = 4;SELECT * FROM product WHERE name LIKE '香%';INSERT INTO student VALUE (1, '小明', '男');primary key(既不重复,也不为空,放字段后)unique(该字段不能重复,放字段后)comment = ' '(放字段后)not null(放字段后)

2024-03-18 17:44:14 365

原创 MySqL数据库常用DDL语句

- 16.如果我们修改字段时,仅需要修改数据类型或约束,不需要修改字段名称,也需要再写一遍旧字段名称需求:将aaa.cxk表中的stuid字段修改为int类型,约束为not null。-- 18.扩展:如果进需要修改字段的数据类型或约束,不需要修改字段名称,我们也可以使用modify进行修改。-- 10.查看数据表的详细信息,或者说查看数据表的字段详情DESC test_db.student;-- 13.查看表中的字段详情。-- 15.查看表中的字段详情。-- 17.查看表中的字段详情。

2024-03-16 20:56:41 334

原创 Linux常用命令

linux常用命令,小白专用

2024-03-14 20:58:14 885 2

原创 Linux初始配置

大数据解决的就是海量数据的存储问题,和海量数据的计算问题大数据的特点: 大多值快信。

2024-03-13 21:38:10 992 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除