- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 IntelliJ IDEA 2016.2.4
http://www.jetbrains.com/idea/download/download-thanks.html?platform=windows 下载地址 http://www.ituring.com.cn/article/37792 使用手册
2016-09-21 16:24:30 491
原创 Ambari——大数据平台的搭建利器
https://www.ibm.com/developerworks/cn/opensource/os-cn-bigdata-ambari/
2016-09-21 16:02:38 371
原创 linux常用查找命令场景
1、知道有这个文件,但是不知道到底在哪里。 eg: find / -name hdfs-site.xml 2、想找一个文件,但是记不住改文件的全称了。 eg: find . -name 'h*' find . -name 'h*' -ls(显示该文件的详细信息) 136628931 12 -rw-r--r-- 1 root root 12225 May
2016-09-21 15:37:18 375
原创 pandas、DataFrame、python三者的关联性
pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在pandas中用DataFrame组织数据。 在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了。
2016-08-10 18:40:19 1048
原创 Hadoop名词解释
1.Hadoop, Apache开源的分布式框架。 2.HDFS, hadoop的分布式文件系统 3.NameNode, hadoop HDFS元数据主节点服务器,负责保存DataNode 文件存储元数据信息。 4.JobTracker, hadoop的Map/Reduce调度器,负责与TackTracker通信分配计算任务并跟踪任务进度。 5.
2014-01-19 19:34:22 1761
原创 Google云计算GFS+MapReduce
云计算的特点 1、超大规模 2、虚拟化 3、高可靠性 4、通用性 5、高可伸缩性 6、按需服务 7、极其廉价 云计算的分类 lIaaS:Infras tructure as a Service 将基础设施作为服务 lPaaS:Platform as a Service 将平台作为服务 l
2014-01-10 16:59:34 1200
原创 Hadoop解决两个问题
Hadoop解决两个问题 海量数据的存储 -- HDFS 海量数据的分析 -- MapReduce Hadoop = The Hadoop projects 和Hadoop相关的一些项目 Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, Oozie
2014-01-10 15:23:10 711
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人