- 博客(12)
- 资源 (26)
- 问答 (1)
- 收藏
- 关注
转载 Hadoop集群配置中如何写入和读取数据?
本节和大家继续学习一下有关Hadoop集群性能优化中机架感知配置方面的内容,主要包括写入数据和读出数据两大部分,希望通过本节的介绍大家对Hadoop集群中机架感知配置有一定的认识。 Hadoop集群功能测试 以下是分别就配置了机架感知信息和没有配置机架感知信息的hadoopHDFS启动instance进行的数据上传时的测试结果。 写入数据 当没有配置机架信息时,所有的机器hadoop都默认在
2015-10-30 21:38:09 1357 3
转载 大数据挖掘技术之DM经典模型
实际上,所有的数据挖掘技术都是以概率论和统计学为基础的。 下面我们将探讨如何用模型来表示简单的、描述性的统计数据。如果我们可以描述所要找的事物,那么想要找到它就会变得很容易。这就是相似度模型的来历——某事物与所要寻找的事物越相似,其得分就越高。 下面就是查询模型,该模型正在直销行业很受欢迎,并广泛用于其它领域。朴素贝叶斯模型是表查找模型中一种非常有用的泛化模型,通常表查询模型适用
2015-10-30 21:33:42 9423
转载 深入 Python 列表的内部实现
本文将介绍列表在 CPython中的实现,因为毕竟Cpython 又是 Python 最为常用的实现。Python 中的列表非常强大,看看它的内部实现机制是怎么样的,一定非常有趣。下面是一段 Python 脚本,在列表中添加几个整数,然后打印列表。 可以发现,列表是一个迭代器。列表对象的 C 语言结构体。 Cpython 中的列表实现类似于下面的 C 结构体。ob_item 是指向列表对象的指针
2015-10-30 21:12:53 1289
转载 ODPS MapReduce入门
MapReduce 原理简介 以MapReduce中最经典的wordcount应用为例,来分析一下MapReduce的全过程。这里我们要统计文件中每个单词出现的次数。 Input就是我们要处理的原始数据,一共有3行。 Splitting步骤是分配任务,这里把任务分给3台机器同时处理,每台机器只负责处理一行的数据。 Mapping步骤就是这3台机器具体要做的事情。在这里每台机器要做的就是统计一
2015-10-21 15:13:55 3233 2
翻译 Graph Visualization and Navigation in Information Visualization: A Survey 译文
图像可视化和信息可视化导航:文献综述Ivan Herman, Member, IEEE Computer Society, Guy MelancËon, and M. Scott Marshall摘要:这是一个关于图形可视化和导航技术的调查,同时这些技术也在信息可视化中应用。图形出现在很多应用中,比如网页浏览、状态转换关系图和数据结构。在这些可能很大的抽象的图形中可视化和导航的能力通常是一个应用至
2015-10-18 13:53:21 3742
转载 星际穿越的完全解析
理科生这样看: 黑洞为何能“吞噬”光著名科普作家、中科院国家天文台客座研究员卞毓麟介绍,黑洞是科学家根据广义相对论做出的一个重要推测,1969年由美国物理学家约翰·惠勒命名。这个推测已被天文学观测证实。也就是说,黑洞是真实存在的,是宇宙中的一种天体。其之所以称为“黑洞”,是因为无法用光或其他形式的电磁波观测它,任何发射到黑洞的光都会被吸收,而不会反射回来。这是什么原因呢?让我们从地球引力讲起。人在
2015-10-17 23:20:57 10172
转载 ubuntu 15.04下使用Eclipse搭建Hadoop开发环境
1、前期准备:已经安装好了jdk、hadoop、eclipse.如果有问题,参考: http://blog.csdn.net/a1b2c3d4123456/article/details/49181021 http://blog.csdn.net/a1b2c3d4123456/article/details/492032372、下载 hadoop-eclipse-plugin-1.2.1.jar
2015-10-17 15:02:21 719
原创 ubuntu15.04 搭建eclipse环境
1、首先要保证安装了jdk,如果没安装参考一下教程: http://blog.csdn.net/a1b2c3d4123456/article/details/491810212、eclipse官网下载压缩包(下载正确版本啊) http://www.eclipse.org/downloads/?osType=linux&release=undefined3、下载下来后,先把压缩包复制到主文件夹下,
2015-10-17 13:19:11 893
转载 在ubuntu 15.04下安装VMware Tools
在Ubuntu 15. 04版本上,不能实现剪贴板的共享 解决方法:发现没有装VMware Tools 1. 点击菜单栏,虚拟机 → 安装VMware工具 → Install 2.若没有反应,再选择虚拟机 →可移动设备→ CD/DVD→ 设置 选择你装虚拟机下的目录,点击 Linux.iso 再重新点击安装VMware Tools 这样会弹出一个包VMwareTools-9.6.0
2015-10-16 20:36:11 3685
转载 Ubuntu14.10 更新源
首先备份源列表(for sure):sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup打开终端,然后输sudo gedit /etc/apt/sources.list回车输开机密码然后回车然后就打开那个文件了,然后修改 最后保存。 然后,刷新列表:sudo apt-get update源列表: Utopic(14.10)版本 U
2015-10-16 19:02:24 3408
原创 VMware 虚拟机 +安装linux +搭建Hadoop
1、首先下载VMware 虚拟机,VMware Workstation 12.0.0 Pro 正式版下载地址如下: http://www.qiankoo.com/thread-3990-1-1.html2、接着下载linux套件,比如说unbutu,稳定的版本推荐14.10 直接在官网下载即可,地址: http://ubuntu-china.cn/download 找个符合自己的版本,先下载
2015-10-16 18:58:15 18409
转载 Linux命令大全
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuin
2015-10-15 17:05:58 3523 1
ACM程序设计
2016-11-16
Multi-View K-Means Clustering on Big Data
2016-04-06
图像可视化的综述+原文+译文
2015-10-18
如何进行机器学习算法的实验?
2015-10-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人