自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 批次效应之R包ComBat - 多平台

批次效应之R包ComBat - 多平台数据处理

2024-07-23 15:55:22 481

原创 R绘制分组热图

① 表达矩阵(按照分型排序好)② 构建临床分组数据。

2024-07-01 18:59:42 140

原创 R绘制分组热图

R绘制分组热图

2024-06-12 15:51:19 187

原创 R绘制渐变火山图

渐变火山图

2024-06-12 10:06:26 178

原创 关于Python中set_index和reset_index的用法

当我们需要对数据表索引进行设定时,常用到set_index()和reset_index()函数进行索引设置,下面通过简单的例子分析进一步了解其用法。

2023-12-25 15:57:37 1102

原创 关于Oracle数据库闪回技术

通过回滚错误的提交数据,吧数据库的部分数据恢复到从前的状态,Oracle提供了4中不同的闪回技术,每种功能和限制各异,也有重叠的功能,但是任何一种闪回技术的原因通常都是为了纠错,所以了解哪种闪回技术适用于纠正那些不同类型错误是至关重要的。

2023-12-11 22:33:23 440 1

原创 掌握NumPy数组对象ndarray

Python 提供了一个array 模块。array 和list 不同,它直接保存数值,和C 语言的一维 数组比较类似。但是由于Python 的array 模块不支持多维,也没有各种运算函数,因此也 不适合做数值运算。NumPy 的诞生弥补了这些不足。NumPy 提供了一种存储单一数据类型 的多维数组——ndarray。

2023-12-08 21:48:01 430

原创 关于Matplotlib数据可视化基础

调用方法:plt.bar(x, height, width,color, edgecolor, bottom, linewidth, align, tick_label, align)若想化成一行两列,修改fig.add_subplot(x, y , z)参数,x代表行数,y代表列数,z图所在位置。绘制多线程子图 (两行一列排版)

2023-12-06 21:41:45 980 1

原创 数据库用户管理

使用CREATE USER语句创建一个新的数据库用户,执行该语句的用户必须具有CREATE USER系统权限,在创建用户之前,首先要确认该用户的一些信息,如用户名称,用户采用的验证方式,,默认的表空间和临时表空间,允许用户在表空间中使用的空间配额。原因:刚创的新用户就像新生儿一样,什么都没有,所有需要授权session 才能与数据库保持会话。要删除的用户模式下包含模式对象,就必须带参数 CSACADE。① 查看表空间动态视图,选择合适的表空间和临时表空间。② 如果没有就创建一个新的表空间。

2023-12-03 15:33:20 348 1

原创 在虚拟机里怎么安装Hive?Hive与SQL的交互应用

遗漏的命令语句是解压:tar -zxvf 包名。

2023-11-24 10:45:08 578 1

原创 网络爬虫 - 新浪财经

获取新浪财经的股票数据,包括:股票编号,名称,最新价,最高价,最低价。要求:爬取前3页的数据,并保存到csv文件中。

2023-11-23 22:13:56 1040

原创 日志文件 - 章节实训

1、查看当前系统有几个日志组,第几个日志组是当前日志组,日志序列号是几?2、增加一个日志组,组中包含一个日志成员。位置:/opt/oracle。3、为刚刚新增的日志组再增加一个成员,成员位于/opt/oracle下。4、为数据库系统保留两个日志组。查看结果确认有两个大小一样的日志组。当前系统有3个日志组,第1个日志组时当前日志组,日志序列号为1。5、查看数据库的归档模式,并回答:数据库处于哪个模式?disable 非归档模式。

2023-11-23 22:06:02 366

原创 表空间的管理 - 章节实训

8、模拟SXTBS02其中一个数据文件发生故障的处理:关闭数据库,将该文件改名(模拟出问题的文件),重新启动数据库,截图结果,并说明产生这一结果的原因,及在此情况下,如何打开数据库。查看SXTBS02的数据文件位置,表空间脱机,移动数据文件物理位置,同步系统逻辑移动位置,重新联机,查看数据文件移动后的物理位置。2、创建本地管理表空间SXTBS02,大小4M,包括一个数据文件位于/opt目录,每个区的大小为128K。3、通过修改数据文件大小,将表空间SXTBS02大小增加为5M。

2023-11-23 22:04:32 977

原创 重做日志和归档日志

文章概述:了解和掌握Oracel数据库重做日志文件和归档日志文件的结构、工作过程以及如何管理重做日志和归档日志。重做日志文件是用于数据库故障恢复的文件,依然是Oracle数据库3类重要物理文件之一。

2023-11-23 21:59:31 957

原创 临时表空间和UNDO表空间管理

文章概述:临时表空间和UNDO表空间是用于存储临时数据和还原数据的特殊表空间。在发生实例化故障时,UNDO段用来对数据进行恢复。

2023-11-21 22:34:19 128

原创 表空间的管理

文章内容:表空间是数据库的逻辑组成部分,而表空间物理上由一个或多个数据文件组成,本章主要讲解表空间和数据文件的概念及关系,并介绍表空间的创建方法和基本的管理操作。摘要:创建表空间修改表空间的属性删除表空间。

2023-11-20 23:05:47 65 1

原创 Spark Streaming编程实现流的词频操作

往ch6 文件夹下传输三个文本文件,用来模拟真实输入的数据流,以spark-submit命令运行上面编写好的py文件。套接字流的输入:这里使用nc命令,linux自带的写入程序;还是老样子,Spark Streaming 编程翻译过来就是创建一个新的.py文件实现词频统计的操作。在/opt/apps/code/ch6目录下新建一个.py文件,用来编写流的操作。提前准备好两个终端,一个用作套接字流的输入,一个用作程序的运行。运行程序 -- 查看各个地方购买行为的统计结果。运行程序 - 产生文件。

2023-11-18 23:14:26 226 1

原创 1. 掌握Hadoop的安装和配置

配置 ResourceManager,NodeManager 的通信端口,web监控端口等,负责管理集群中的资源,并为运行在集群上的应用程序分配资源,其中参数可以影响YARN的资源分配、调度、容错等方面的行为,可以配置YARN的最大内存使用量、最大CPU使用量、最大磁盘使用量,还可以配置YARN的日志输出路径、节点管理器的心跳间隔、应用程序的最大重试次数等。HDFS的相关设定,如文件副本的个数、块大小及是否使用强制权限等,此中的参数会覆盖hdfs-default.xml文件中默认设置。

2023-11-09 10:43:23 34 1

原创 linux虚拟机安装java环境

linux虚拟机安装Java环境。写出安装步骤并截图显示Java版本号的命令和结果

2023-11-08 18:07:46 247 1

原创 采用Spark Streaming编程实现套接字流统计词频操作并将结果存入到文件和数据库中

② 执行nc 命令,linux自带的写入程序,参数 [- l] :local(主机),[- k] :端口号。①在vm虚拟机上运行code,创建一个新的py文件,编写程序(socket_streaming.py)③以spark-submit 方式运行socket_streaming.py。

2023-11-08 17:51:15 110 1

原创 spark实现kafka流数据的操作

本次目标:kafka的安装和配置kafka测试spark读取kafka数据。

2023-11-08 17:18:02 210 1

原创 爬虫入门 - 将天气预报的数据存储在MySQL数据库中

爬虫入门 - 将天气预报的数据存储在MySQL数据库中

2023-11-07 16:57:18 430

原创 爬虫入门 - 爬取简书互联网前十页文章

在本文中,我们将介绍怎样使用Python爬取简书的文章。首先,我们需要用到Python中的一个网络爬虫框架——BeautifulSoup。它可以帮助我们方便地解析HTML和XML文档,从而获得文档中的内容。主要目的:2️⃣ 要求将各个功能模块封装为函数。

2023-11-02 15:53:07 1098 1

原创 爬虫入门 - 爬取网页《斗破苍穹》前十章

在上面网页元素中可以确定标题在下面的h1标签里 ,正文内容在下面的所有p标签里。1 首先打开需要分析得网页,查看网页元素信息,找到需要爬取得标题和内容。1:利用requests库和正则库爬取斗破苍穹小说的前十章标题和内容。主要的模块:requests、time、re。2:将屏幕输出结果并存入txt文件中。

2023-11-02 11:25:41 730 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除