大数据培训之旅——Oracle-1(简介,安装)

    来来来,重点来了,Oracle数据库,先不说这玩意怎么用,先来点必备知识,首先说说能存储数据的东西,大家首先想到的应该是Excel表格,他也可以简单的看成一个数据库,但是他记录的数据是有限的,现在大公司一天随随便便就是几十几百G的数据,更有的天天几个T的数据,这些要放到Excel里面,不得给他累死啊,数据库就解决了点这个问题,数据库可以用很快的速度去在很多很多条记录里面找到其中的一条,还可以满足很多条件,就像之前简单介绍的mysql数据库,数据库最常见的就是MySQL毕竟开源,然后就是Oracle了,当然还有其他的比如微软的SQLSever,这里我们主要介绍的是Oracle,当然这个公司的名字也是这个,甲骨文公司。Oracle公司的数据库产品主要有5类:关系型数据库:MySQL;关系型数据库:Oracle;内存级数据库:Timsten;一体化设备:Exadata;分布式:NoSQL。来说说这些东西的特点:在关系型数据库之前的数据库,表比较少,访问量比较大,io都集中在某几个表中,而关系型数据库将表进行区分,把表互相关联,查询一个结果的时候可能会用到好多表,减少了io,增加了效率,比如主键约束,这个后面会介绍,大概就是一个表中有且只有一个不重复字段,这个字段就是主键,这个字段也可以被其他表引用,这时候就成为其他表的外键。

    再来详细说说MySQL,这是个开源的产品,大家都可以在原有的代码上进行修改定制来完成自己的需求;最大的好处就是不要钱,毕竟都是穷人,当然也不能白用,MySQL有一些升级的服务,需要收费,但是一般很少人会去使用;MySQL占用率较大,很多互联网公司都适用MySQL数据库,毕竟不花钱,而且lamp(apache+php+mysql+linux)框架里面都是开源的,集成度比较好,而且相当省钱,一些中小型的公司都会使用,毕竟不是哪个公司都是互联网一霸;MySQL是一个轻量级的数据库,一个表大概能承载5000W条记录,数据量不大的时候还是蛮好用的,而且他的内存机制,日志机制,一致性,完整性都没有Oracle好用,当然也可能收费的升级服务就是优化这些……所以注定了免费的只能用于中小企业。

    到了Oracle数据库了,Oracle是企业级的数据库,是非开源的而且是收费的;能做到海量数据的存储,用在:银行,电信,电网,电力这些产数据量超级多的地方;他存储的数据量更大,数据仓库中存储几亿条数据很正常,大的业务每天会增长上G的数据,1000W条数据大概有2-5G,比如通信公司,通信记录,短信记录那都是数据,如果一天100G那就是大概2亿条数据,这么多的量MySQL肯定是操作不起来的。

    Exdata这东西是Oracle收购Sun公司之后,在他的服务器上开发出来的一体化设备,都是按照机柜来卖的,这东西的什么都是搞定的,那回来基本上就可以用了,当然价格也超级超级“友好”;当然即使这么贵也会有人买的,大公司那么多人才,这种架构很容易就能搭建出来而且省钱,买这种机柜肯定是有一些不为人知的核心技术。

    来拿电商举例子说说数据库的情况吧,比如按照业务类型划分:物流业务,在线交易业务,客户关系业务;按照数据量也可以划分,比如到达多少之后做分库操作,比如买鞋和买衣服的分为两个库;也有可能按照地域划分:什么东北,华北,东南,华南的,也有可能是按省市划分的。这几种常用的划分方式并不冲突,也有可能同时使用,具体得看业务要求和数据量了。

    来看看一种构架吧:

    OLTP(在线交易类型库)特点:在数据库的架构中,在最前面;请求次数多,占用资源少,对应着前端客户端;能够进行读写操作;以G为单位

    OLAP(分析业务)特点:一般是数据仓库,只提供给内部人员作分析;请求次数少,每个请求占用资源多,每次读几千万行用来做数据分析;能够进行读操作;以T为单位。

    当然Oracle再厉害也有数据处理不了的问题,于是就得使用之后的Hadoop来进行分布式的处理了,把数据分成不同的块存储在多个机器中,那么hadoop可以处理大数据,那为什么不把所有数据都来使用hadoop处理,这样使用一种技术就可以了,但是大家想过么,如果我们搬运电脑,我们需要搬显示器,机箱,鼠标键盘,三个人就足够了,如果按分布式来算,需要把机箱中的每个东西都拆成零件,然后搬到地方在组装,这还没有三人搬来得快。所以只有数据达到一定级别才可以使用hadoop,比如家里开了个超市,一共就两个人,用Oracle来做数据管理,那不就是扯呢么,光买Oracle的钱都够扩张超市的了,所以使用MySQL就可以解决了,当然像银行这种数据量,用MySQL也不可能,所以需要按照业务来选择最趁手的工具。

    来说说国内的Oracle的版本,8i,9i(i代表internet,那时候互联网在国内没太普及,Oracle能在所有互联网中使用所以也算见名知意);10G,11G(g是grid的缩写,网格化,将资源平均分配,这个Oracle会自动分配,哪里资源多,就会分给那);12C(C是cloud的缩写,是云服务器,这东西一时半会还普及不了,毕竟数据要稳定)。一般只要功能满足了,就不会更换版本,毕竟老板不管这些,只管结果。下面来安装下Oracle这里使用10G做演示。

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

    我们挂载镜像然后使用yum -y install安装:binutils,compat-db,control-center,gcc*,glibc,libXp,libstdc++,libstdc++-devel,make,openmotif,sysstat,control-center

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

       core - 限制内核文件的大小

       date - 最大数据大小

  fsize - 最大文件大小

  memlock - 最大锁定内存地址空间

  nofile - 打开文件的最大数目

  rss - 最大持久设置大小

  stack - 最大栈大小

  cpu - 以分钟为单位的最多 CPU 时间

  noproc - 进程的最大数目

  as - 地址空间限制

  maxlogins - 此用户允许登录的最大数目

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

——————————————————————————————————————————————————————

    这样我们的oracle就安装完成了,而且我们也创建了一个叫ecom的库,你可能会有疑问,为什么oracle只有一个库,而mysql中show databases会有那么多,oracle是单实例单库的数据库,正常情况下只有一个数据库,而所有的表都在这个库里。下一篇文章将会介绍oracle的基础,数据字典以及基础的SQL

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值