- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 IntelliJ IDEA 2016.2.4
http://www.jetbrains.com/idea/download/download-thanks.html?platform=windows 下载地址http://www.ituring.com.cn/article/37792 使用手册
2016-09-21 16:24:30 502
原创 Ambari——大数据平台的搭建利器
https://www.ibm.com/developerworks/cn/opensource/os-cn-bigdata-ambari/
2016-09-21 16:02:38 380
原创 linux常用查找命令场景
1、知道有这个文件,但是不知道到底在哪里。eg:find / -name hdfs-site.xml2、想找一个文件,但是记不住改文件的全称了。eg:find . -name 'h*'find . -name 'h*' -ls(显示该文件的详细信息)136628931 12 -rw-r--r-- 1 root root 12225 May
2016-09-21 15:37:18 383
原创 pandas、DataFrame、python三者的关联性
pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在pandas中用DataFrame组织数据。在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了。
2016-08-10 18:40:19 1058
原创 Hadoop名词解释
1.Hadoop, Apache开源的分布式框架。2.HDFS, hadoop的分布式文件系统3.NameNode, hadoop HDFS元数据主节点服务器,负责保存DataNode 文件存储元数据信息。4.JobTracker, hadoop的Map/Reduce调度器,负责与TackTracker通信分配计算任务并跟踪任务进度。5.
2014-01-19 19:34:22 1766
原创 Google云计算GFS+MapReduce
云计算的特点1、超大规模2、虚拟化3、高可靠性4、通用性5、高可伸缩性6、按需服务7、极其廉价云计算的分类lIaaS:Infras tructure as a Service 将基础设施作为服务lPaaS:Platform as a Service 将平台作为服务l
2014-01-10 16:59:34 1207
原创 Hadoop解决两个问题
Hadoop解决两个问题海量数据的存储 -- HDFS海量数据的分析 -- MapReduceHadoop = The Hadoop projects和Hadoop相关的一些项目Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, Oozie
2014-01-10 15:23:10 721
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人