- 博客(15)
- 收藏
- 关注
原创 Python详解01_Python相关软件安装和MD(markdown)文件编辑语法
Python相关软件安装和MD(markdown)文件编辑语法
2024-06-21 16:06:00 1171
原创 Oracle详解笔记
ORACLE 数据库系统是美国 ORACLE 公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或 B/S 体系结构的数据库之一。比如SilverStream 就是基于数据库的一种中间件。ORACLE 数据库是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。
2024-06-20 14:03:33 1235
原创 python中单引号和双引号的区别
假如你想定义一个字符串my_str,其值为: he said “I like you” ,则可以采用如下方式,通过转义字符 \ 进行定义。但是这两种通用的表达方式,除了可以简化程序员的开发,避免出错之外,还有一种好处,就是可以减少。假如你想定义一个字符串my_str,其值为: I’m a teacher,则可以采用如下方式,通过转义字符 \ 进行定义。也可以不使用转义字符,利用单引号直接进行定义。在Python当中表达字符串既可以使用单引号,也可以使用双引号,那两者有什么区别吗?1、包含单引号的字符串。
2023-04-01 15:34:22 723
原创 centos7扩容根目录(/dev/mapper/centos-root)
使用虚拟机扩展磁盘后,在系统内进行分区1、查看分区状况根目录在/dev/mapper/centos-root[root@git50 ~]# df -h文件系统 容量 已用 可用 已用% 挂载点/dev/mapper/centos-root 17G 9.9G 7.2G 59% /devtmpfs 1.9G 0 1.9G 0% /devtmpfs 1.9G 1
2022-06-06 17:00:02 3831 1
原创 08-Hbase
08-HBase1.目标概述了解HBase基本概念了解HBase架构掌握HBase集群环境搭建掌握HBase中shell操作掌握HBase中java API操作掌握rowKey的设计原则【延伸】MapReduce操作HBase【延伸】spark操作HBase2.HBase基础2.1.基本概念2.1.1.介绍官网地址:http://hbase.apache.org/HBase在Hadoop之上提供了类似于Bigtable的能力,是BigTable的开源实现版本,通过java编程
2022-03-22 16:48:12 3063
原创 07-SparkStreaming
07-Spark Streaming1.目标掌握spark Streaming的原理和架构掌握DStream的相关操作实现spark Streaming与flume整合实现spark Streaming与kafaka整合2.spark Streaming介绍2.1.什么是spark Streamingspark Streaming类似于Apache Storm,用于流式数据处理。根据官方文档介绍,spark Streaming有高吞吐量和容错能力强等特点。spark S
2022-03-22 16:11:36 2292
原创 06-SparkSQL
1.spark sql1.1.spark sql概述官网地址:http://spark.apache.org/sql/1.1.1.什么是spark sqlspark sql是spark用来处理结构化数据的一个模块,它提供了一个编程抽象DataFrame,作为分布式SQL查询的引擎,它是将spark sql转换成RDD,然后提交到集群中去运行,执行效率非常快。支持多种使用方式:SQL、DataFrame API、DataSet API。相比于spark RDD API,spark sql包含了对结
2022-03-18 10:58:25 4110
原创 05-SparkRDD原理和编程接口
1.弹性分布式数据集RDD1.1.RDD概述1.1.1.什么是RDDRDD(Resilient Distributed DataSet)弹性分布式数据集。是spark中最基本的数据抽象,是一个不可变的、可分区的、可并行计算的集合。Resilient:数据可以选择性的存储在内存中,或者磁盘中Distributed:分布式存储、分布式计算DataSet:用于存放数据的数据集合1.1.2.RDD的属性A list of partitions:分区列表,数据集基本组成单位说明:每个分区对应一个
2022-03-18 10:16:25 761
原创 04-Spark入门
04-Spark入熟悉spark相关概念搭建spark集群编写简单的spark应用程序2.spark概述2.1.什么是sparkspark是基于内存的快速、通用、可扩展的大数据分析计算引擎。它的计算速度非常快。但是仅仅只涉及到数据的计算,并没有涉及到数据的存储。2.2.为什么要学习spark运行速度比mapreduce快很多2.3.spark特点速度快(比mapreduce在内存中快100倍,在磁盘中快10倍)spark中的job中间结果可以不落地,
2022-03-01 21:02:36 1946
原创 Linux命令ifconfig报错command not found
Linux系统ifconfig命令用于显示或设置网络设备。在本机虚拟机中安装linux后,输入ifconfig想要查看IP地址,却提示command not found ,看来是没有安装包含该命令的包了。以下为解决办法。1、查看是否真的没有设置IP地址:命令行中输入ip addr,若看到有ip地址,则说明已设置正常,若没有则需要设置一个。设置ip地址的方法:进入配置文件路径cd /etc/sysconfig/network-scripts编辑配置文件vim ifcfg-eth0(配置文件名后缀也
2020-05-31 01:07:42 25019 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人