自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Linux学习笔记

Linux学习笔记 一、命令的基本语法格式 命令名称 [选项] [目录或者文件] 例如:查看当前目录下的所有文件 ls -a 二、常用命令 **命令格式:**命令 [-选项] [参数] 如:ls -la /usr 大部分命令遵从该格式 多个选项时,可以一起写 eg:ls –l –a 可以写成: ls –la 简化选项与完整选项(注:并非所有选项都可使用完整选项) 1、帮助命令 1.man man [命令或者配置文件] (功能描述:获得帮助信息) 显示说明: 信息 功能

2020-11-04 11:29:32 32

原创 大数据之HIVE的安装

大数据之HIVE的安装 安装分两个阶段: 1、安装mysql服务 2、安装数据仓库工具HIVE 一、安装mysql服务 1、在node03节点上安装mysql服务 在root用户 下安装,root用户权限大方便我们的mysql的安装 在CentOS7中默认安装有MariaDB,这个是MySQL的分支,但为了需要,还是要在系统中安装MySQL,而且安装完成之后可以直接覆盖掉MariaDB。 2.下载并安装官方的mysql的yum源 使用root用户在node03服的/kkb/soft路径下执行以下命令 cd

2020-07-22 11:25:59 44

原创 大数据之数据仓库

大数据之数据仓库 数据仓库 1、数据仓库的基本概念 数据仓库(Data Warehouse,可简写为DW或DWH)是用来构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它处于分析报告和决策支持目的而创建的。 数据仓库本身并不"生产"数据,同时也不"消费"任何数据,数据来源于外部供给外部使用,这也是为什么叫数据仓库,而不是工厂的原因。 2、数据仓库的四大特征 2.1、面向主题的 数据仓库是一般从用户实际需求出发,将不同平台的数据源按设定主题进行划分整合,与传统的面向事务的

2020-07-22 10:55:13 63

原创 数据分析之pandas(一)

数据分析之pandas(一) 简介 pandas 是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 数据结构 Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、b

2020-07-03 18:39:50 62 1

原创 python数据分析之Numpy(三)

python数据分析之Numpy(三) 一、数组的拼接 1、竖向拼接vstack() import numpy as np import matplotlib.pyplot as plt arr1 = np.arange(1,10).reshape(3,3) arr2 = np.arange(10,19).reshape(3,3) print(arr1)#[[1 2 3] [4 5 6] [7 8 9]] print(arr2)#[[10 11 12] [13 14 15] [16 17 18]] a

2020-07-02 19:47:46 150

原创 python数据分析之Numpy(二)

python数据分析之Numpy(二) 一、Numpy读取文件 loadtxt()方法 numpy.loadtxt(fname, dtype=, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0) 参数 作用 fname 被读取的文件名(文件的相对地址或者绝对地址) dtype 指定读取后数据的数据类型 comments 跳过文件中指定开头的行(

2020-06-30 00:39:58 132

原创 python数据分析之numpy(一)

python数据分析之Numpy(一) 一、什么是Numpy? ​ NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库 [1] 。 二、创建数组 了解了numpy的概念我们就来感受一下一下它的强大吧! Numpy三种创建数组的方法 1、

2020-06-25 00:37:03 136

原创 数据结构——链表

数据结构——链表 一、概念 ​ 链表(Linked list)是一种常见的基础数据结构,是一种线性列表,但是并不会按线性的顺序存储数据,而是在每一个节点里存到下一个节点的指针(Pointer)。链表通常由一连串节点组成,每个节点包含两种域,即信息域和指针域,信息域可以存储任意的实例数据(data fields)指针域包含一或两个用来指向上一个或下一个节点的位置的链接(“links”)。 二、链表的优点和缺点 优点 1、由于链表不必须按顺序存储,链表在插入的时候可以达到O(1)的复杂度,比另一种线性表顺序表

2020-05-22 22:42:17 98

空空如也

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除