自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 资源 (6)
  • 收藏
  • 关注

转载 Java技术面试答案(汇总版)

1.面向对象和面向过程的区别面向过程优点:性能比面向对象高,因为类调用时需要实例化,开销比较大,比较消耗资源;比如单片机、嵌入式开发、Linux/Unix等一般采用面向过程开发,性能是最重要的因素。缺点:没有面向对象易维护、易复用、易扩展面向对象优点:易维护、易复用、易扩展,由于面向对象有封装、继承、多态性的特性,可以设计出低耦合的系统,使系统更加灵活、更加易于维护缺点:性能比面向过程低2.Jav...

2018-04-25 12:14:42 472

原创 联想昭阳UOS1043专业版镜像下载地址

联想昭阳UOS1043专业版镜像下载地址: https://cdimage-download.chinauos.com/desktop-professional/1043/uniontechos-desktop-20-professional-1043-amd64.iso。

2023-04-07 13:31:55 706

转载 Hive/Spark SQL常用函数(窗口分析函数、行列转换、JSON处理)

文章目录窗口分析函数 1. 分析函数 2. 聚合函数 3. 窗口函数 行列转换 1. 行转列 2. 列转行 JSON处理 1. JSON对象 2. JSON数组 Hive SQL Spark SQL 时间处理窗口分析函数函数中用到的表数据如下图:1. 分析函数row_number() rank() dense_rank()这3个函数通常用在组内.

2022-05-17 21:34:11 1695

原创 用户画像及其应用案例分享

一、用户画像基础概念用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,对用户特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像已在各领域得到了广泛的应用。用户画像在实际应用中往往以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。如下用户画像示例图所示。二、用户画像PERSONAL八要素用户画像产品需要怎么做呢,用户画...

2021-08-08 10:15:20 15643

转载 以程序员的视角带你看西安

编者荐语:作为一名土生土长的陕西人,我曾经在西安上了7年的学(本硕),2018年硕士毕业来到深圳,已工作3年左右。最近几年西安的热度不断,抖音上不倒翁小姐姐、大唐不夜城火了,全国十四运这个夏天也要来了。今天,就让我们一起以程序员的视角带你去看看西安。以下文章来源于微信公众号CS指南,作者大白最近越来越多的人关注到西安这座城市,西安热度和知名度进一步提升,抖音上不倒翁小姐姐和大唐不夜城火了,全国第十四届运动会这个夏天也要来了。今天,就让我们一起以程序员的视角带你去看看西安.

2021-07-16 00:32:45 5895

转载 2021年大数据面试宝典完整版(含答案解析)

版本 更新时间 更新内容 v1.0 2020-07-01 新建 v1.1 2020-07-18 朋友面试大数据工程师提供的关于架构及数仓方面的题目 v1.2 2020-08-08 朋友面试数据专家提供的数据驱动,spark及flink方面面试题 v1.3 2020-08-22 朋友面试数据开发提供的关于hive及数仓方面的题目 v1.4 2020-09-06 老徐提供面试题(数仓方向)及朋友提供数据开...

2021-06-09 02:22:46 6488 1

转载 【转载】PinPoint(开源APM)全链路监控环境搭建

PinPoint(开源APM)全链路监控简介Pinpoint是一个开源的 APM (Application Performance Management/应用性能管理)工具,用于基于java的大规模分布式系统,基于Google Dapper论文。仿照 Google Dapper , Pinpoint 通过跟踪分布式应用之间的调用来提供解决方案, 以帮助分析系统的总体结构和内部模块之间如何相互联系。如今的服务通常由很多不同模块组成,前端向后台发起一个查询请求,后台服务可能要调用多个服务,每个服

2020-07-08 20:44:30 883

转载 Linux学习路径图

2019-09-18 00:10:57 129

转载 在shell中如何判断HDFS中的文件目录是否存在

在Linux文件系统中,我们可以使用下面的Shell脚本判断某个文件是否存在: # 这里的-f参数判断$file是否存在 if [ ! -f "$file" ]; then   echo "文件不存在!" fi 但是我们想判断HDFS上某个文件是否存在咋办呢?别急,Hadoop内置提供了判断某个文件是否存在的命令: [iteblog@www...

2019-09-12 01:34:21 1007

转载 Hive操作表分区和表字段属性常用语句

文章目录1显示分区 2添加分区 3删除分区 4修改分区 5添加列 6修改列 7修改表属性 8表的重命名显示分区 show partitions iteblog; 添加分区 ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCA...

2019-09-12 01:06:36 375

转载 Hive常用函数大全一览

文章目录1关系运算 1.11、等值比较: = 1.22、不等值比较: 1.33、小于比较: < 1.44、小于等于比较: <= 1.55、大于比较: > 1.66、大于等于比较: >= 1.77、空值判断: IS NULL 1.88、非空判断: IS NOT NULL 1.99、LIKE比较: LIKE 1.1...

2019-09-12 00:49:17 931

转载 Hive语句的书写顺序及执行顺序

1、Hive语句的书写顺序:(从前往后)(1)select(2)from(3)join on(4) where(5)group by(6)having(7)distribute by/cluster by(8) sort by(9) order by(10) limit(11) union(去重不排序)/union all(不去重不排序)2、Hive语句的执行顺序:...

2019-09-12 00:05:26 1089

原创 Hadoop常见命令 完整版

1、列出根目录下所有的目录或文件hadoop fs -ls /2、列出/user目录下的所有目录和文件Hadoop dfs -ls /user3、列出/user目录及其子目录下的所有文件(谨慎使用)hadoop dfs -ls -R /user4、创建/soft目录hadoop dfs -mkdir /soft5、创建多级目录had...

2019-09-11 00:20:31 1970

转载 Hadoop Shell 常用命令

FS Shell调用文件系统(FS)Shell命令应使用bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中...

2019-09-08 17:50:51 199

原创 Linux 常用命令总结

2019-09-08 17:21:27 94

转载 Git常用命令速查表(收藏大全)

名词master: 默认开发分支 origin: 默认远程版本库 Index / Stage:暂存区 Workspace:工作区 Repository:仓库区(或本地仓库) Remote:远程仓库一、新建代码库二、配置Git的设置文件为.gitconfig,它可以在用户主目录下(全局配置),也可以在项目目录下(项目配置)。三、增加/删除/修改文件四、代码...

2019-09-08 17:07:15 102

转载 Git 工作原理图与常用命令速查表

一、Git 工作原理图与常用命令速查表

2019-09-08 17:05:25 126

转载 看我Git 72变,GitHub发布4已超过8000星

简介:众所周知,Git是一个“分布式版本管理工具”,简单的理解版本管理工具。本文介绍了与使用Git相关的72个技巧,文末附带一张超详细的脑图。GitHub发布3天已经超过4000星,值得收藏!来源:GitHub编辑:金磊众所周知,Git是一个“分布式版本管理工具”,简单的理解版本管理工具。本文介绍了与使用Git相关的72个技巧,文末附带一张超详细的脑图。GitHub发布3天已经超过4...

2019-09-07 00:37:03 127

转载 1000行 MySQL 学习笔记,不怕你不会,就怕你不学!

简介:1000行 MySQL 学习笔记,不怕你不会,就怕你不学!Windows服务-- 启动MySQL net start mysql-- 创建Windows服务 sc create mysql binPath= mysqld_bin_path(注意:等号与值之间有空格)连接与断开服务器mysql -h 地址 -P 端口 -u 用户名 -p 密码SHOW...

2019-09-07 00:31:16 206

转载 Hive 动态分区使用

hive 动态分区与静态分区,静态分区需要制定分区字段的值插入分区数据,动态分区可以根据分区字段的值自动插入对应分区静态分区:须指定分区字段的值insert overwrite table test.tmp_edw_customer_event_detail_di partition(dt='20161218') select cid ...

2019-09-05 01:08:08 160

原创 Hive 动态分区恢复静态分区表数据

在企业上使用 Hive进行离线批量数据统计时,有时会遇到 Oozie工作流调度失败,导致很多 ptdate时间分区没有数据,可以通过 Hive创建临时表存储所有缺失的ptdate时间分区数据,然后通过Hive动态分区查询临时表导入数据至最终统计结果表中。一、在正式介绍 Hive 动态分区恢复静态分区表数据时,先介绍一下 hive load导入数据的用法hive ...

2019-09-05 00:59:46 559

原创 Linux常见命令

1、查看当前运行用户id2、查看 ip地址ifconfig

2019-09-04 23:59:46 77

原创 Hive、Impala常用命令

一、Hive常用命令查看分区show partitions lake_bg_ods.ods_bg_tb1;查看建表语句show create tablelake_bg_ods.ods_bg_tb1;二、Impala常用命令查看分区以及各分区数据大小以及存储HDFS路径show partitions lake_bg_o...

2019-09-04 00:48:45 313

原创 Git常见命令

git add . 添加工作区修改至暂存区git -commit -m "Git本地仓库代码修改内容" 添加暂存区内容至本地Git代码库git reset head^ 撤销本地Git代码库最新一次commit提交内容git push 直接提交本地Git代码库commit内容至远程Git代码git branch 查看当前分支git branch...

2019-09-04 00:39:15 1919

转载 Spark 框架核心组件,以及Spark和Hadoop生态关系

Spark框架是一个快速且API丰富的内存计算框架。Spark 采用Scala语言编写。相对于第一代的大数据生态系统Hadoop中的MapReduce,Spark 无论是在性能还是在方案的统一性方面,都有着极大的优势。Spark框架包含了多个紧密集成的组件,如下图所示。1. Spark Core位于底层的是Spark Core,其实现了Spark的作业调度、内存管理、容...

2019-08-28 00:45:32 1618

转载 Spark大数据处理框架入门-包括生态系统、运行流程以及部署方式

Spark 大数据处理框架简介Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架。Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而...

2019-08-28 00:24:58 615

转载 Flink1.7.2+Kafka 接收流数据并打印到控制台

一、试验环境Windows:IDEALinux:Kafka,Zookeeper二、POM和Demo2.1、pom.xml文件<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3....

2019-07-28 11:23:36 3336

转载 机器学习100天 GitHub经典项目

机器学习100天 GitHub经典项目网页链接地址:1、机器学习100天 英文版原文GitHub地址:GitHub - Avik-Jain/100-Days-Of-ML-Code: 100 Days of ML Codinghttps://github.com/Avik-Jain/100-Days-Of-ML-Code2、机器学习100天 中文翻译版GitHub地址:GitHu...

2019-01-29 22:44:31 861 2

转载 pycharm pip源修改以及包管理

pycharm下如何将默认的pip源改成国内能快速访问的源, 以及如何进行包管理pycharm 是一款进行python项目开发的利器, 不过还是有新手在使用pycharm时, 并不知道如何进行包管理,pip 包管理pycharm 如何进行包管理呢, 其实很简答安装安装包流程如下注意2位置, 是选择相应版本的python 解释器, 因为我们可能会用virtualenv ...

2019-01-26 23:58:03 1789

原创 如何使用PyCharm进行Python开发_20190123

1、Python集成开发工具主要包括以下2个:(1)PyCharm(需另外安装Python),推荐使用该Python集成开发工具;(2)Anaconda(不需要另外安装Python,该集成开发工具安装后自带Python)2、安装Python3.7及集成开发工具PyCharm进行Python开发参考链接:这里Python3.7的安装路径为:D:\Programs\Python37,安装...

2019-01-24 00:37:16 316

转载 处理海量数据问题之六把密匙

密匙一、分而治之/Hash映射 + Hash统计 + 堆/快速/归并排序1、海量日志数据,提取出某日访问百度次数最多的那个IP。    既然是海量数据处理,那么可想而知,给我们的数据那就一定是海量的。针对这个数据的海量,我们如何着手呢?对的,无非就是分而治之/hash映射 + hash统计 + 堆/快速/归并排序,说白了,就是先映射,而后统计,最后排序:1. 分而治之/hash映射:针对数据太大,...

2018-05-02 20:36:27 255

转载 大数据面试题

 Big Data 面试题总结JAVA相关1-1)List 与set 的区别?老掉牙的问题了,还在这里老生常谈:List特点:元素有放入顺序,元素可重复 ,Set特点:元素无放入顺序,元素不可重复。 1-2)数据库的三大范式?原子性、一致性、唯一性 1-3)java 的io类的图解 1-4)对象与引用对象的区别对象就是好没有初始化的对象,引用对象即使对这个对象进行了初始化,这个初始化可以使自己的直...

2018-04-25 21:59:01 20542

转载 大数据面试题及答案-汇总版

         大数据面试题及答案汇总版                  当前版本:Ver 1.0制作单位: 编写人员:审 核 人: 签 收 人: 签署日期:    2017 年 05 月 22 日 版权所有 翻印必究文档信息版本号1.0版本日期2017-05-22所有者 作者修订记录日期描述作者版本号2017-05-22新增                                  ...

2018-04-25 21:55:22 2434

转载 大数据相关面试题整理-带答案-难一点

1、fsimage和edit的区别?  大家都知道namenode与secondary namenode 的关系,当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit,fsimage是保存最新的元数据的信息,当fsimage数据到一定的大小事会去生成一个新的文件来保存元数据的信息,这个新的文件就是edit,edit会回滚最新的数据。2、列举几个配置文件优化? --发挥 ...

2018-04-25 19:11:31 380

原创 Map与Reduce任务个数的控制方法

1、Map任务个数的控制方法2、Reduce任务个数的控制方法

2018-04-24 10:18:28 306

转载 CentOS取消屏幕保护自动锁屏功能

CentOS取消屏幕保护自动锁屏功能1. 问题:默认启动屏幕保护问题描述: CentOS系统在用户闲置一段时间(默认为5分钟)后,会启动屏幕保护程序(默认的屏保为黑屏),并要求重新输入密码才能回到原来桌面。2. 解决方法:重新设置屏幕保护2.1 打开Screensaver Preferences界面2.2 取消屏幕保护的锁定功能

2018-01-31 10:37:30 1334

转载 CentOS赋予一个普通用户root权限

Linux的普通用户在安装一些东西或者执行一些命令的时候,终端会提示权限不够。那么怎么才能给用户赋予root权限呢?当然,就算赋予了root权限,也和root用户还是有区别的,因为只能执行root规定好的一些操作命令。1、添加用户,首先用adduser命令添加一个普通用户,命令如下:#adduser tommy //添加一个名为tommy的用户#passwd tommy

2018-01-31 09:54:23 1639

原创 Hadoop3.0.0伪分布式、完全分布式安装及其新特性介绍

本文主要介绍了Hadoop3.0.0伪分布式、完全分布式集群安装及其新特性,并在文章最后一部分第四部分给出了Hadoop3.0.0在本地虚拟机Linux系统(2G物理内存)上的伪分布式集群安装的实际操作过程。

2017-12-16 15:32:38 875

打造以客户为中心的流程管理体系

打造以客户为中心的流程管理体系

2022-02-13

40个思维模型(知识地图模型)

40个思维模型(知识地图模型),包括:学习金字塔、费曼技巧、RIA阅读法、二八定律、黄金圈法则、5W1H分析法、思维导图、SWOT分析、六顶思考帽、头脑风暴、逆向思维、类比思维、SCAMPER创新思维、设计思维、最小可行性产品(MVP)、AARRR漏斗模型、情绪ABC模型、冰山模型、故事五要素、SRAR模型、STORY模型、领导力梯队、情景领导力模型、GROW教练模型、管理4C模型、TOPIC模型、系统思维、整合思维模型等思维模型

2022-02-09

数字孪生应用白皮书(2020版)

数字孪生应用白皮书(2020版),本白皮书力求以较为浅显易懂的方式对数字孪生 相关定义、特征进行阐述,并针对当前数字孪生的技术热点、应用领域、产业情况和标准化工作进展进行了分析。白皮书涵盖了 6 个领域共计 31个数字孪生应用案例。 本白皮书通过梳理数字孪生技术和产业应用发展情况,分析数字孪生技术热点、行业动态和未来趋势,提出相关的标准化工作需求,希望可以作为数字孪生技术领域、产业发展和标准化之间的初始连接纽带,加快推动数字孪生发展应用。

2022-02-09

携程技术2021年度合辑(大数据、人工智能、云计算)

携程技术2021年度合辑(大数据、人工智能、云计算)

2022-02-09

机器学习Python代码实践

机器学习Python代码实践,包括Python基本概念以及常见的机器学习算法代码实现

2019-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除