让头发掉下来-CSDN博客

原创 R语言做主成分分析在我国城镇居民家庭平均每人全年消费性支出分析中的应用

2019-2020学年第2学期统计数据建模课程论文题目： **R语言做主成分分析在我国城镇居民家庭平均每人全年消费性支出分析中的应用** 姓名：张明彦学号： 170314...

2020-08-02 01:10:54 11197 3

Sqoop是一款用于Hadoop与传统数据库间数据迁移的开源工具。文章详细介绍了Sqoop的安装配置、基本使用方法和常用参数，重点阐述了数据导入/导出操作。主要内容包括：环境搭建（需Java和Hadoop环境）、配置文件修改、JDBC驱动配置；数据导入的三种模式（全量、查询、增量）及HDFS/Hive/HBase的导入示例；数据导出到关系型数据库的方法；常用命令参数说明（如import/export/codegen等）。文章还提供了测试案例和注意事项，如Sqoop1与Sqoop2的兼容性问题，是指掌握大数据

2025-08-02 11:52:45 1132

原创大数据技术之Hive

声明：原文来自于《尚硅谷》免费学习资料文章仅供学习，如需详细了解请光顾《尚硅谷》官网

2024-10-27 23:06:49 1473

原创高级技术之 Shell

1）Linux 提供的 Shell 解析器有2）bash 和 sh 的关系3）Centos 默认的解析器是 bash。

2023-12-29 14:29:01 1070

原创 Tableau服务器部署方案

tableau服务器部署方案

2022-12-12 22:12:08 1527

原创 05、hive数据仓库介绍及搭建

Hive起源于Facebook（一个美国的社交服务网络）。Facebook有着大量的数据，而Hadoop是一个开源的MapReduce实现，可以轻松处理大量的数据。但是MapReduce程序对于Java程序员来说比较容易写，但是对于其他语言使用者来说不太方便。此时Facebook最早地开始研发Hive，它让对Hadoop使用SQL查询（实际上SQL后台转化为了MapReduce）成为可能，那些非Java程序员也可以更方便地使用。hive最早的目的也就是为了分析处理海量的日志。 Hi

2022-06-24 14:25:26 2675

原创 04、Hbase介绍及搭建

HBase是一个分布式的、面向列、非关系型的开源数据库，该技术来源于Fay Chang所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。Hadoop是一个高容错、高延时的分布式文件系统和高并发的批处理系统，不适用于提供实时计算； HBase是可以提供实时计算的分布式数据库，数据被保存在HDFS分布式文件系统上HBase HRegion servers集群中的所有的region的数据在服务器启动时都是被打开的，相应的这就在一定程度上加快系统响应；而Hadoop中的block中的数

2022-06-24 13:39:44 761

原创 03、hadoop集群安装

hadoop的思想来源是Google，Google曾经面对一个问题，大量的网页怎么存储，怎么快速搜索的问题，于是三篇论文诞生了GFS、Map-Reduce、BigTable，这三篇论文的开源实现版本分别就是hadoop的hdfs、mapreduce和hbase，分别对应大数据存储、大数据分析计算、列式非关系型数据库。 hadoop本身就是一个软件，一个用java写好的软件，只要你电脑上装好了jdk，就能运行。 hadoop1.0软件本身有两个模块，hdfs和mapreduce，hadoop2

2022-06-24 10:18:53 475

原创 02、基础环境搭建及Zookeeper介绍与搭建

写在前面：在查看本文之前，需要先学习01、VMware中Centos7安装教程搭建好虚拟机以及需要学会克隆虚拟机。因为整个完全分布式集群的搭建至少需要3台机器，需要克隆2台命名为slave1与slave2两个从节点，而被克隆的主机称为主节点master。本次集群搭建共有三个节点，包括一个主节点master，和两个从节点slave1和slave2。具体操作如下：1.以主机点master为例，首次切换到root用户：su2.修改主机名为master： hostnamectl set-hostname ...

2022-06-23 18:06:54 950

原创 01、VMware中Centos7安装教程

一.安装前准备VMware14.0https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.htmlCentOS 7.2 64位镜像http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_64-DVD-1708.iso二.在VMware中创建虚拟机1.打开VMware，点击文件，选择新建虚拟机（或者直接使用Ctrl+N快捷键），然后选择自定

2022-06-22 16:42:14 216

原创 ARIMA 模型的建立

一、实验目的了解 ARIMA 模型的特点和建模过程，了解 AR，MA 和 ARIMA 模型三者之间的区别与联系，掌握如何利用自相关系数和偏自相关系数对 ARIMA 模型进行识别，利用最小二乘法等方法对 ARIMA 模型进行估计，利用信息准则对估计的 ARIMA 模型进行诊断，以及如何利用 ARIMA 模型进行预测。掌握在实证研究如何运用 Eviews 软件进行 ARIMA 模型的识别、诊断、估计和预测。二、基本概念所谓 ARIMA 模型，是指将非平稳时间序列转化为平稳时间序列，然后将平稳

2022-06-21 10:31:12 684

原创 python数据分析-numpy学习

什么是数据分析？数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。使用python做数据分析的常用库 numpy 基础数值算法 scipy 科学计算 matplotlib 数据可视化 pandas 序列高级函数 numpy概述 Numerical Python，数值的Python，补充了Python语言所欠缺的数值计算能力。 Numpy是其它数据分析及机器学习库的底层库。

2022-05-23 17:11:02 772

原创 MySQL函数学习

具体示例讲解日期函数，字符串函数，以及窗口函数的使用

2022-05-23 13:16:55 568

原创时间序列分析在我国社会消费品零售总额预测中的应用

摘要社会消费品零售总额是指企业通过交易售给个人、社会集团，非生产、非经营用的实物商品金额，以及提供餐饮服务所取得的收入金额。社会消费品零售总额是表现国内消费需求最直接的数据。社会消费品零售总额是国民经济各行业直接售给城乡居民和社会集团的消费品总额。它是反映各行业通过多种商品流通渠道向居民和社会集团供应的生活消费品总量，是研究国内零售市场变动情况、反映经济景气程度的重要指标。本文以我国社会品零售总额的预测为背景，利用时间序列分析对我国1969-2018年社会消费品零售总额建立AMIMA模型，较...

2022-05-02 11:27:27 1673

原创 Tableau学习教程（万字保姆级教程）

Tableau学习教程（保姆级教材，学不会私信留言来找我）从BI系统开发的角度来学习tableau工具，更学会报表开发的流程内含学习使用数据源，tableau打包工作簿，可直接提取使用 ...

2022-05-01 22:18:28 60548 39

转载 Pandas速查表

1.导入库包import pandas as pd # 最新为 1.4.1 版本 (2022-02-12)import numpy as npimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline2.导入数据3# 从 CSV 文件导入数据pd.read_csv('file.csv', name=['列名','列名2'])# 从限定分隔符的文本文件导入数据pd.read_table(filena

2022-03-18 11:21:25 772

原创 SQL性能技巧与规范

SQL优化

2022-03-15 15:28:59 278

原创 SQL常用语句总结

总结常用SQL语法

2022-03-15 10:07:14 700

原创 kettle学习-01查找表映射

1.1 实验目的利用 Kettle 的“合并排序”等组件，构建面向对象分析的数据仓库。 1.2 实验要求熟练掌握“排序记录”，“合并排序”，“字段选择”等组件的使用，构建面向对象分析的数据表格。 1.3 实验原理通过“排序记录”对多张表格的外键进行排序，然后通过“记录集连接”进行多表连接，再通过“字段选择”选择合适的字段输出到表格。 1.4 实验步骤 1.4.1 创建转换:点击，在下拉菜单中点击选择这样创建了一个转换文件。我们点击图片，重命名该转换文件，.

2022-03-09 16:22:18 605

原创 Hive学习：数据仓库的建立

【实验目的】熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用；了解大数据处理的基本流程；熟悉数据预处理方法；熟悉在不同类型数据库之间进行数据相互导入导出。【实验原理】数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。Hive是一个构建于Hadoop顶层

2022-03-09 15:09:58 9296

原创 Tableau快速表计算与表计算函数

快速表计算 Tableau内置了部分常用的表计算，称之为 “快速表计算”，这些快速表计算可以视为是预设好的表计算表达式，我们也可以通过把视图的快速表计算拖入度量中查看具体的表计算公式。比如说，我们在实例中添加了“总额百分比Percent of Total”，然后可以拖入度量生成字段，之后查看它的计算公式，如下图：A 常见快速表计算第一类的快速表计算与日期无关，常见的七种快速表计算的基本对应关系如下：汇总 Running Total=RUNNING_SUM(SUM([S..

2022-02-24 15:08:40 5536

原创 Tableau权限设置

Tableau权限控制

2022-02-16 17:07:44 2493

原创 SQL练习题简单篇

SQL语句练习题附建表语句，学不会我把我手剁下来寄给你实验一<数据定义>（1）创建学生管理数据库create database xsglon (name=xsgl,filename='E:\SQL\xsgl.mdf',size=5mb,maxsize=50mb,filegrowth=1mb);–（2）分别创建3个表并插入数据use xsgl;create table student(Sno char(10) primary key,Sname char(8),S

2021-07-29 16:27:57 3263

原创 Tableau学习之表格动态表头实现

问题引入如下图所示，使得红色方框中的表头随着年份下拉框的变动而变动，别纠结表格如何制作，下期博客讲解。说明：当我年份筛选器选择2020年，表头出现2020，当年份筛选器选择2021年，表头出现2021 。实现1.将现在的固定表头隐藏，如下图：2.创建参数。右点击左侧空白区域，点击创建参数同理在创建参数ACT.。3.创建计算字段4。新建工作表，命名为fcst，将新间字段FCST1拉到标记栏中，选择年份筛选框并显示。ACT1同理。5.设置仪表盘将3个工作表全部加载到仪表盘，然后设置

2021-04-28 17:53:15 2167

原创 Tableau学习之表格占比实现

问题引入如下图excel表格数据求各个员工的销量占比？要求1.在不使用tableau函数的情况下实现2.利用tableau函数创建新字段实现3.对某一个员工不做占比，销量总和中不含这个员工的销量，占比中默认为100%，占比总和中也不含这个员工的占比。实现1.在不使用tableau函数的情况下实现数据加载就不做过多的赘述复制一份度量栏度量销量，更名为占比，放到标记栏中，选择文本点击度量值栏中占比下拉箭头，选择快速表计算，选择合计百分比。然后再表格中右击表头重命名为占比，就ok了。

2021-04-27 10:57:41 2936 1

原创搭建Linux环境下的Spark环境

一、准备1、系统：ubuntu2、安装包：Spark2.3.3+Java8+Scala2.11二、步骤1、官网下载Spark 安装包spark-2.3.3-bin-hadoop2.7.tgz2、官网下载scala安装包scala-2.11.12.tgz3、官网下载JDK安装包jdk-8u201-linux-x64.tar.gz4、Spark相关配置4.1安装SSH，附代码以及截图sudo apt-get updatesudo apt-get install openssh-server

2020-09-15 15:24:56 449

原创销售数据预处理

实验目的：1.熟悉Linux系统、MySQL、Insight等系统和软件的安装和使用；2.了解大数据处理的基本流程；3.熟悉数据抽取、转换、装在方法；4.熟悉在不同类型数据库之间进行数据相互导入导出实验内容：本实验对两个数据源：employee_info_table.sql代表员工信息表；sales_info_table.sql表示销售信息表做数据预处理。实验过程：1.实验准备：1.1启动数据库：sudo -iservice mysql startmysql -uroot -p123

2020-08-20 00:56:56 945 1

原创 Tableau制作我国疫情数据可视化报表

实验概述：利用已知数据源（2019-cNoV），在Tableau软件中制作数据可视化图表（数据来源世卫组织）实验内容：软件的熟练安装；加载2019-cNoV(截至到2019)数据；制作工作表1（全国确诊病例表）；制作工作表2（湖北确诊病例表）；制作工作表3（全国城市确诊病例排名表）；制作工作表4（确诊人员趋势表），以时间维度制作；制作工作表5（全国城市出院率趋势图）制作仪表板实验过程：一、加载数据二、制作工作表将维度栏中“省份”右击选择“地理角色”在选择“省/市/自治区”

2020-07-31 00:23:23 3700 6

Spark综合题题库.docx

2021-04-27

从数据到图表-tableau快速入门学习教程

从数据到图表-tableau快速入门学习教程，内涵相关学习数据源与视频教程

2022-05-24

spark考试练习题含答案.rar

2022-06-22

截图软件ha_FSCapturev9.7

特点：电脑截长图，绘图，修图 1.捕捉活动窗口； 2.捕捉滚动窗口； . . . . .

2022-06-21

Mysql实战深层原理讲解

01讲基础架构：一条SQL查询语句是如何执行的 02讲日志系统：一条SQL更新语句是如何执行的 03讲事务隔离：为什么你改了我还看不见 04讲深入浅出索引（上） 05讲深入浅出索引（下） 06讲全局锁和表锁：给表加个字段怎么有这么多阻碍 07讲行锁功过：怎么减少行锁对性能的影响 08讲事务到底是隔离的还是不隔离的 09讲普通索引和唯一索引，应该怎么选择 10讲MySQL为什么有时候会选错索引 11讲怎么给字符串字段加索引 12讲为什么我的MySQL会“抖”一下 13讲为什么表数据删掉一半，表文件大小不变 14讲count这么慢，我该怎么办 15讲答疑文章（一）：日志和索引相关问题、 16讲“orderby”是怎么工作的 17讲如何正确地显示随机消息 18讲为什么这些SQL语句逻辑相同，性能却差异巨大 19讲为什么我只查一行的语句，也执行这么慢 20讲幻读是什么，幻读有什么问题 21讲为什么我只改一行的语句，锁这么多 22讲MySQL有哪些“饮鸩止渴”提高性能的方法 23讲MySQL是怎么保证数据不丢的 24讲MySQL是怎么保证主备一致的 25讲MySQL是怎么保证高可用的

2022-06-01

03 Tableau数据地图实战

03 Tableau数据地图实战内涵相关学习数据源与课程视频：

2022-05-24

Tableau数据分析实战（进阶篇-2）

Tableau学习进阶教程，分1和2两部分；详细学习请下载：tableau数据分析实战（进阶篇-1） tableau数据分析实战（进阶篇-2）内含相关学习数据源

2022-05-24

tableau数据分析实战（进阶篇-1）

Tableau学习进阶教程，分1和2两部分；详细学习请下载：tableau数据分析实战（进阶篇-1） tableau数据分析实战（进阶篇-2）内含相关学习数据源

2022-05-24

Tableau数据分析实战（基础-1）

Tableau学习基础教程，分1和2两部分；详细学习请下载：tableau数据分析实战（基础-1） tableau数据分析实战（基础-2）

2022-05-24

tableau数据分析实战（基础-2）

Tableau学习基础教程，分1和2两部分；详细学习请下载：tableau数据分析实战（基础-1） tableau数据分析实战（基础-2）内含相关学习数据源

2022-05-24

360套excel可视化看板

内含： 1..动态图表使用教程 2.各类图表制作 3.数据可视化大屏看板（如： 1-电商销售情况仪表盘1.xlsx 2-产品收入成本分析可视化看板1.xlsx 3产品销售分析仪表(图表联动，选择分析)1.xlsx 4-可视化数据分析看板图形图表1.xlsx 5-可视化销售数据分析图表1.xlsx 6-年度预算表-图表分析表1.xlsx 7-年终总结销售分析可视化图表1.xlsx 8-人事招聘分析图表.xlsx 9-销售数据分析可视化报表1.xlsx 10-营销数据可视化看板1.xlsx 11-一季度预算支出对比.xlsx 12-业绩分析表.xls 13-全年项目收入分析.xls 14-企业基本开销支出分析.xlsx 15-年度入职与离职人员统计.xlsx 16-年度地区男女数据分析.xlsx 17-季度销量情况同比分析.xlsx 18-季度商品销量情况.xlsx 19-红色目标实际数据分析.xlsx 20-各市场数据图表分析.xlsx 21-各年按季度数据分析.xlsx 22-各部门人员统计报告.xlsx ........ 360套，可以直接套用模板）

2022-05-23

ETL-kettle学习实验（教程+数据）

2022-03-09

python二级考试试题.rar

全国计算机等级考试二级python

2021-04-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人