自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 大数据培训之旅——简介

    写这些文章的主要目的就是复习一下自己在培训的时候学到的关于大数据的知识,因为需要回学校完成毕业设计,所以再重新学的时候已经忘得差不多了,而且又面临着找工作的难题,虽然是计算机专业但是学校学的确实很¥&##@*让人无语,所以总结总结顺便记录一下。当然我会把学到的全部写出来,还不会的话就得去百度找大佬的文章学习了。我也属于萌新,所以呢,欢迎大佬们指点批评,如果是和我一样的萌新,也希望我...

2018-07-10 19:51:07 381

原创 大数据培训之旅——Oracle-11(备份,rman)

很久很久以前,Oracle就开始提供用来摄取表、模式或整个数据库的定义,然后导入到其他模式或数据的小工具:那就是exp/imp那个时候数据库规模都很小(几百M就算超大数据库了),而且对于数据库的要求也没有那么高,不像现如今,动不动就是7*24小时高并发、高可用,以至在某些领域,exp/imp也被看作备份恢复的工具使用并延续至今。如果你使用exp备份几十G、数百G甚至更大规模数据库,并且将...

2018-08-07 14:17:59 467

原创 大数据培训之旅——Oracle-10(容灾,闪回)

如果有个库10T大小,我用哪种手段备份?数据量比较大,有一种备份方式rman用rman要考虑备份速度,人家问你10T要多少时间,就是看你的一个磁盘写的速度。生产中 200m/s,它肯定是个盘阵,起码是个raid。10t=10000000m/200m=50000s/3600s=大约13小时在公司备份10T数据用rman大约13小时,是不是时间太长了。这13小时内,磁盘的IO都被备份操作占...

2018-08-06 16:54:58 398

原创 大数据培训之旅——Oracle-9(索引,undo)

    不知道大家听没听说过索引,这东西就像一个目录,可以帮我们快速找到我们想要的信息,建议大家以一个字段设为索引。当然我们也可以不这么做,这只是个建议,下面来看看不用索引的时候查询速度是怎么样的    create table t11 as select * from dba_objects;    set autotrace traceonly;    select * from ...

2018-08-04 19:42:31 324

原创 大数据培训之旅——Oracle-8(存储过程,权限)

    存储过程这东西还是相当关键的,说白了就是一堆 SQL 的合并,当然中间需要套用逻辑业务,类似于Java中的程序。【优点】  1.存储过程只在创造时进行编译,以后每次执行存储过程都不需再重新编译,而一般 SQL 语句每执行一次就编译一次,所以使用存储过程可提高数据库执行速度。    2.当对数据库进行复杂操作时(如对多个表进行 Update,Insert,select,Delete...

2018-08-03 19:30:56 713

原创 大数据培训之旅——Oracle-7(控制文件,日志文件,表管理)

    我们登录Oracle的时候会新建一个回话,这个会话在v$session中可以查询到——————————————————————————————————————————————————————    这些用户名为空的是Oracle自动生成的进程,我们不可以操作,如果杀掉进程或者会话,会影响数据库的使用。这些进程里就有DBWn,也就是昨天体系结构的进程,这个进程满足一定条件的时...

2018-08-02 14:58:38 213

原创 大数据培训之旅——Oracle-6(体系结构)

    来说说oracle的体系结构,这东西理论更多了……先给大家看个图片——————————————————————————————————————————————————————    我们用的客户端就是User process比如我们的浏览器逛淘宝,之后买东西搜索的时候,就会产生一个PGA(用户全局区)会有几兆大小用来存放SQL,下一个黑乎乎的东西是我们的ecom数据库实例,这里...

2018-08-01 20:25:24 232

原创 大数据培训之旅——Oracle-5(sqlldr,参数文件,字符集,手工建库)

    对于我们的oracle来说,数据就是命根子……这些数据除了通过前端过来,还需要我们手动录入,但是录入会累死人的,于是我们可以利用命令来导入有规律的数据,比如我们来看看如何从Excel中导入数据。    来说说第一种:这个是Excel的技术了,就是自己写公式,这没法具体说,不然就变成了Excel教程了,大家去看看Excel怎么写公式就可以了,这里给个思路,用公式功能批量生成insert语...

2018-07-31 22:48:55 522

原创 大数据培训之旅——Oracle-4(监听,配置文件)

    大家有没有想过,我们之前在用jdbc的时候连接过MySQL数据库,可那是在windows上的。很多大型服务都需要使用oracle数据库,而windows server的稳定性又不如Linux好,为了追求稳定,我们需要连接Linux数据库,那么……这该怎么连接呢?这时候就需要监听文件了,通过配置监听文件,之后启动监听来盯着某一端口下的数据库连接请求,MySQL端口我们之前了解到是3306,那...

2018-07-30 19:54:14 192

原创 大数据培训之旅——Oracle-2(基础操作,数据字典,基础SQL)

    我们在上一篇里把Oracle10g安装好了,那么也算是有工具了,下面就得看看如何使用了。————————————————————————————————————————————————————————————————————————————————————————————————————————————    既然登陆了那来看看数据字典,数据字典说白了就是系统表,有三类...

2018-07-29 16:57:13 360

原创 大数据培训之旅——Oracle-1(简介,安装)

    来来来,重点来了,Oracle数据库,先不说这玩意怎么用,先来点必备知识,首先说说能存储数据的东西,大家首先想到的应该是Excel表格,他也可以简单的看成一个数据库,但是他记录的数据是有限的,现在大公司一天随随便便就是几十几百G的数据,更有的天天几个T的数据,这些要放到Excel里面,不得给他累死啊,数据库就解决了点这个问题,数据库可以用很快的速度去在很多很多条记录里面找到其中的一条,还可...

2018-07-28 15:51:27 188

原创 大数据培训之旅——Java-9(设计模式、Java Web)

    java终于要完事了,最后一篇Java的文章,设计模式和Java Web,当然因为我们不是纯Java开发,所以这俩了解了解就可以了。这篇应该是文字最多的了。Java之后应该就是Oracle数据库了。如果励志成为DBA的话,就得好好看看Oracle了。    设计模式这东西不属于任何一种编程语言,是人为的一种规定,来让我们更好地写程序。设计模式的目的就是解耦,就是降低耦合度。写一堆重复的...

2018-07-26 14:40:01 388

原创 大数据培训之旅——Java-8(线程)

    啦啦啦,到线程了,这东西影响力可大,首先来看看什么是进程,进程就是内存中运行的应用程序,每个进程在内存中都有一块属于自己的空间,比如我们的浏览器,qq,什么吧啦吧啦的东西都可以叫做进程。那线程呢,线程就是,进程中的执行流程。一个进程中最少有一个线程,当然也可以有多个。比如我们打开了qq这就是个进程,然后聊天,视频,远程协助都会开启新的线程。当然理论上线程越多进程能做的操作就越多,但是什么都...

2018-07-25 16:36:28 181

原创 大数据培训之旅——Java-7(反射,io流)

    从这往后说的对我来说比jdbc什么的高级多了,比如这篇文章介绍的反射,再比如后面的io流,线程什么的。反射用来松耦合超级好用,说完反射之后我们会给把我之前写的反射和jdbc结合的代码发出来,大家可以看看。    我们平时使用一个类都是public class a{成员属性,成员方法},然后在主方法里新建对象调用,这是用对象来调用类,而反射则是用类去描述某个类以及其内部特征,比如随便一个...

2018-07-24 22:02:23 209

原创 大数据培训之旅——Java-6(MySQL基础,jdbc)

    不知道大家对数据库有多少了解,我们在网上看到的信息都被存储在数据库中,比如,我们csdn的账号和密码,或者游戏里的装备信息等等,数据库无时无刻不在支持这我们的操作,没有数据库什么都白扯,那大家有没有想过,我们现在看到的页面,难道是直接连到数据库上的么?怎么可能,直接连上去岂不是什么都暴露了,我们一般会将数据库的连接写在后端代码里面,而对于java web来说,我们连接数据库的代码被称作jd...

2018-07-23 20:39:28 135

原创 大数据培训之旅——Java-5(集合类)

    数组大家都知道很重要,那么来看看另外一个很重要的干货,集合类。这东西的重要性不比数组差,甚至更加重要。想必学过数学的大家也知道集合是什么东西,那就不仔细解释这个了,我们直接来干货。    在所有的集合类中,他们有着同一个最基本的集合接口,Collection,java中提供的集合类都继承与他的子接口,Collection是接口,所以不能直接实例化对象,同时他还有很多子接口,而且子接口还...

2018-07-22 21:51:05 183

原创 大数据培训之旅——Java-4(数组,api)

    数组来了,这东西贯穿整个java,基本上是个能拿出手的程序,就需要数组,那么什么是数组呢,就是相同类型数据的集合,可以理解为,一堆int的数字,我们把它们塞到一个数组里,然后他们就跑到一块去了,然后我们使用的时候只需要去里面找,而不是之前左一个右一个的在程序里面翻。下面来看看如何声明一个数组:type[] 变量名=new type[数组中元素的个数]或者type[] 变量名={逗号分隔的初...

2018-07-21 18:55:51 204

原创 大数据培训之旅——Java-3(类与对象,面向对象)

    这篇文章开始之前,我们先介绍个工具,Eclipse,这东西超级秀,只要有插件,就能使用大部分主流语言编程,当然这是免费的,我用的是MyEclipse,他在Eclipse上做了优化还是蛮好用的,给大家个网址,自己领悟吧,http://ck.crskey.com/post/36.html。废话不多说,我们来看看今天的内容。当然我打过一个java基础的所有源码示例,只不过是都在一起,我在想是一点...

2018-07-20 20:24:15 244

原创 大数据培训之旅——Java-2(数据类型,运算符,分支控制)

    还是java写着顺手啊,这篇文章主要介绍java中的数据类型,以及分支控制语句,在这之前我们先说说昨天的hello word,这东西可是超级经典,基本上学任何语言,第一个例子都是这东西,所以,我们也不免俗套,那么来看看这几行代码都是什么意思吧。——————————————————————————————————————————————————————    当我们运行字节码文件...

2018-07-19 21:59:26 298

原创 大数据培训之旅——Java-1(简介、环境部署以及第一个程序Hello……)

    终于到了Java了,快被Linux折磨疯掉了,因为写了好多oracle和hadoop用不到的命令,超级不熟悉……java就不一样了,贯穿整个大学四年……虽然学校教的比这里介绍的都少,但是好歹一直在用。下面来介绍介绍Java吧。这里说明下,java的所有操作均在windows平台下。    Java可谓是这几年最火的编程语言了,它相对于c语言来说较为简单,我们可以使用自身大量或者从大佬那...

2018-07-18 14:51:22 193

原创 大数据培训之旅——Linux-8(系统监控)

    系统监控这东西,我觉得运维看看还不错,大数据不需要做太多的深入研究,但是因为这是介绍Linux的文章,所以什么都要说一下。当然这里演示的部分相对以前较少,因为一个命令就可以查出来一大堆东西,主要就是介绍这堆东西有什么,都是什么意思,所以文字相对较多。    首先,我们介绍下进程的状态,运行(正在运行或在运行队列中等待)                                ...

2018-07-17 15:15:12 209

原创 大数据培训之旅——Linux-7(web+nfs)

    web这东西可厉害了,我们现在用的网页应该就是这玩意,而且都是使用apache服务软件提供服务的,我们需要安装apache并且安装一个论坛包,不过apache这东西我们的虚拟机应该没有,需要先去安装下,当然我这就不演示了,因为安装是之前程序管理讲过的,所以只做文字说明。    我们先在ip地址为245虚拟机设置里面把红帽5系统的镜像添加到CD/DVD中,然后使用mount命令将镜像挂载,之...

2018-07-15 15:20:39 163

原创 大数据培训之旅——Linux-6(ssh+crontab+at)

    这篇文章介绍的东西还是蛮有趣的,起码在我受培训的时候,用这东西整蛊了不少同学,搞得大家把密码都改了,先说ssh,这东西能为客户机提供一个用户远程管理的安全的shell,根据我的分析SecureCRT就是这个原理,ssh是Linux系统中的一个服务,名称是sshd,服务端主程序存放在:/usr/sbin/sshd,客户端主程序:/usr/bin/ssh,其配置文件均存放在/etc/ssh/下...

2018-07-14 17:01:21 193

原创 大数据培训之旅——Linux-5(磁盘管理)

    既然软件都安装完毕了,那么下一步就是磁盘的管理了,就像windows系统一样Linux也装到磁盘中的(这是句废话),说的这就得说说存储工具,比如:硬盘,软盘,光盘什么的,那么Linux是否可以像windows系统插入硬盘来增加容量呢,答案是必须可以。    对于Linux系统来说我们常用的磁盘有:IDE磁盘(SATA),在系统中被识别为/dev/hdXX              ...

2018-07-13 23:11:46 199

原创 大数据培训之旅——Linux-4(程序管理)

    说到Linux里的程序,算了,这东西太不好用,本来也不是专门取运行程序的系统,当然我们需要安装的运行在服务器中的程序不算,通过这篇文章的介绍,会了解到各种方法去安装各种软件。当然从此以后我们就用SecureCRT作为命令输入工具了,同样这些命令也可以直接在虚拟机里执行。    ...

2018-07-12 23:16:49 164

原创 大数据培训之旅——Linux-3(权限用户及网络设置)

    终于到这个激动人心的时候了,设置完网络就不用这么麻烦的去用虚拟机蹩脚的伪终端了,而且权限以及用户贯穿整个学习过程,算相当重要的一环了。话不多说,直接往下看吧。    说到权限就需要先提下用户,Linux是多用户的操作系统,可能会有超级多的用户,而我们之前使用的是名为root的超级用户,就类似于windows系统中的Administrator用户,拥有对系统的最高权限,除了超级用户之外,还有...

2018-07-12 15:35:13 181

原创 大数据培训之旅——Linux-2(简单的命令)

    书接上回……Linux系统安装完成之后我们就得使用了,不然装他干什么,当然依据培训的老师所说,这东西不用自己弄,因为以后在公司会有运维的大佬弄好,不过多学点总是有好处的。    话不多说,开始真正操作吧,但是在这之前需要说下VMware的一些技巧,比如挂起虚拟机,以及快照————————————————————————————————————————————————————————————...

2018-07-11 21:29:29 155

原创 大数据培训之旅——Linux-1(安装)

    俗话说得好,工欲善其事必先利其器,大数据的分析操作都是在Linux系统中完成的,所以我们需要安装Linux系统,但是我舍弃不了我喜欢的Windows系统,毕竟Windows系统可以打绝大部分游戏……所以呢就需要安装虚拟机,虚拟机说直白点就是用软件在系统中模拟出一台台电脑,具体多少台,看物理机有多大内存了。    当然虚拟机软件的话我是绝对写不出来了,所以直接用培训机构给的了,那就是VMwa...

2018-07-10 23:17:55 146

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除