自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

哆啦A梦的博客

业精于勤荒于嬉,行成于思而毁于随

  • 博客(12)
  • 资源 (26)
  • 问答 (1)
  • 收藏
  • 关注

转载 Hadoop集群配置中如何写入和读取数据?

本节和大家继续学习一下有关Hadoop集群性能优化中机架感知配置方面的内容,主要包括写入数据和读出数据两大部分,希望通过本节的介绍大家对Hadoop集群中机架感知配置有一定的认识。 Hadoop集群功能测试 以下是分别就配置了机架感知信息和没有配置机架感知信息的hadoopHDFS启动instance进行的数据上传时的测试结果。 写入数据 当没有配置机架信息时,所有的机器hadoop都默认在

2015-10-30 21:38:09 1357 3

转载 大数据挖掘技术之DM经典模型

实际上,所有的数据挖掘技术都是以概率论和统计学为基础的。 下面我们将探讨如何用模型来表示简单的、描述性的统计数据。如果我们可以描述所要找的事物,那么想要找到它就会变得很容易。这就是相似度模型的来历——某事物与所要寻找的事物越相似,其得分就越高。 下面就是查询模型,该模型正在直销行业很受欢迎,并广泛用于其它领域。朴素贝叶斯模型是表查找模型中一种非常有用的泛化模型,通常表查询模型适用

2015-10-30 21:33:42 9423

转载 深入 Python 列表的内部实现

本文将介绍列表在 CPython中的实现,因为毕竟Cpython 又是 Python 最为常用的实现。Python 中的列表非常强大,看看它的内部实现机制是怎么样的,一定非常有趣。下面是一段 Python 脚本,在列表中添加几个整数,然后打印列表。 可以发现,列表是一个迭代器。列表对象的 C 语言结构体。 Cpython 中的列表实现类似于下面的 C 结构体。ob_item 是指向列表对象的指针

2015-10-30 21:12:53 1289

转载 ODPS MapReduce入门

MapReduce 原理简介 以MapReduce中最经典的wordcount应用为例,来分析一下MapReduce的全过程。这里我们要统计文件中每个单词出现的次数。 Input就是我们要处理的原始数据,一共有3行。 Splitting步骤是分配任务,这里把任务分给3台机器同时处理,每台机器只负责处理一行的数据。 Mapping步骤就是这3台机器具体要做的事情。在这里每台机器要做的就是统计一

2015-10-21 15:13:55 3233 2

翻译 Graph Visualization and Navigation in Information Visualization: A Survey 译文

图像可视化和信息可视化导航:文献综述Ivan Herman, Member, IEEE Computer Society, Guy MelancËon, and M. Scott Marshall摘要:这是一个关于图形可视化和导航技术的调查,同时这些技术也在信息可视化中应用。图形出现在很多应用中,比如网页浏览、状态转换关系图和数据结构。在这些可能很大的抽象的图形中可视化和导航的能力通常是一个应用至

2015-10-18 13:53:21 3742

转载 星际穿越的完全解析

理科生这样看: 黑洞为何能“吞噬”光著名科普作家、中科院国家天文台客座研究员卞毓麟介绍,黑洞是科学家根据广义相对论做出的一个重要推测,1969年由美国物理学家约翰·惠勒命名。这个推测已被天文学观测证实。也就是说,黑洞是真实存在的,是宇宙中的一种天体。其之所以称为“黑洞”,是因为无法用光或其他形式的电磁波观测它,任何发射到黑洞的光都会被吸收,而不会反射回来。这是什么原因呢?让我们从地球引力讲起。人在

2015-10-17 23:20:57 10172

转载 ubuntu 15.04下使用Eclipse搭建Hadoop开发环境

1、前期准备:已经安装好了jdk、hadoop、eclipse.如果有问题,参考: http://blog.csdn.net/a1b2c3d4123456/article/details/49181021 http://blog.csdn.net/a1b2c3d4123456/article/details/492032372、下载 hadoop-eclipse-plugin-1.2.1.jar

2015-10-17 15:02:21 719

原创 ubuntu15.04 搭建eclipse环境

1、首先要保证安装了jdk,如果没安装参考一下教程: http://blog.csdn.net/a1b2c3d4123456/article/details/491810212、eclipse官网下载压缩包(下载正确版本啊) http://www.eclipse.org/downloads/?osType=linux&release=undefined3、下载下来后,先把压缩包复制到主文件夹下,

2015-10-17 13:19:11 893

转载 在ubuntu 15.04下安装VMware Tools

在Ubuntu 15. 04版本上,不能实现剪贴板的共享 解决方法:发现没有装VMware Tools 1. 点击菜单栏,虚拟机 → 安装VMware工具 → Install 2.若没有反应,再选择虚拟机 →可移动设备→ CD/DVD→ 设置 选择你装虚拟机下的目录,点击 Linux.iso 再重新点击安装VMware Tools 这样会弹出一个包VMwareTools-9.6.0

2015-10-16 20:36:11 3685

转载 Ubuntu14.10 更新源

首先备份源列表(for sure):sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup打开终端,然后输sudo gedit /etc/apt/sources.list回车输开机密码然后回车然后就打开那个文件了,然后修改 最后保存。 然后,刷新列表:sudo apt-get update源列表: Utopic(14.10)版本 U

2015-10-16 19:02:24 3408

原创 VMware 虚拟机 +安装linux +搭建Hadoop

1、首先下载VMware 虚拟机,VMware Workstation 12.0.0 Pro 正式版下载地址如下: http://www.qiankoo.com/thread-3990-1-1.html2、接着下载linux套件,比如说unbutu,稳定的版本推荐14.10 直接在官网下载即可,地址: http://ubuntu-china.cn/download 找个符合自己的版本,先下载

2015-10-16 18:58:15 18409

转载 Linux命令大全

系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuin

2015-10-15 17:05:58 3523 1

逻辑回归python实现

在开源的基础上实现的逻辑回归,纯python实现,采用的是批量梯度下降,用户可以自己换其他的梯度下降方式

2017-10-11

ACM程序设计

《ACM程序设计(第2版)》详细讲解了ACM国际大学生程序设计竞赛(ACM/ICPC)编程、调试方法,以及提高时间、空间性能的策略,并充分利用了C++泛型编程的高效率、规范化的特性,全部采用C++泛型编程。第1章讲解了ACM程序设计入门知识;第2章讲解了C++泛型编程的容器、迭代器和常用算法;第3章讲解了ACM程序设计的基本编程技巧;第4章讲解了50道原版ACM竞赛题的解题思路,并配有C++泛型编程参考答案和题目的中文翻译。《ACM程序设计(第2版)》是一本专门针对ACM国际大学生程序设计竞赛而编写的入门教程,适合参加ACM/ICPC的大学生和C++编程爱好者学习,对ACM/ICPC竞赛教练也具有一定的指导作用。

2016-11-16

数据挖掘常用算法代码实现

数据挖掘常用算法代码实现

2016-11-15

剑指offer--java

剑指offer--java

2016-11-15

文本分类停用词

文本分类停用词,哈工大,北大,百度的

2016-10-26

xgboost编译后的

xgboost编译后的文件,下载后直接解压就可以使用

2016-06-01

The k-means clustering algorithm

The k-means clustering algorithm ----by NG

2016-04-06

Multi-View K-Means Clustering on Big Data

Multi-View K-Means Clustering on Big Data论文简洁讲义

2016-04-06

Gitlab搭建所需软件

搭建gitlab的框架所需要的软件,能够帮助开发者

2016-01-17

ODPS的使用说明

阿里的odps的使用说明,简单快速上手,希望对新手有一些帮助

2015-11-13

深度学习教程——斯坦福

深度学习的入门材料,免费提供诶大家,欢迎一起交流

2015-10-30

图像可视化的综述+原文+译文

Graph Visualization and Navigation in Information Visualization A Survey原文+译文

2015-10-18

SPSS课程资料

spss的专业指导课程,希望能够对大家有帮助。

2015-10-18

机器学习实战的代码和电子版

机器学习实战的代码和电子版,希望对大家有帮助。

2015-10-18

apriori java 数据库读取

apriori挖掘频繁模式和关联规则。本例使用java实现,数据库连接使用的是mysql

2015-08-11

scala 学习资料

学习spark的时候接触到的Scala语言,这里有一套学习资料,希望对大家有帮助。

2015-07-22

pagerank matlab实例

pagerank的一个简单的小实例,使用matlab实现的,附带使用说明。希望可以帮助你。

2015-07-15

深度学习 修改卷积层

修改了卷基层,在卷基层后加了一个预处理层,将数据归一化到500维的正确维度上

2015-07-08

matlab算法大全

matlab的算法大全是用matlab实现的一些常用算法和模型,包括像动态规划和神经网络等等。

2015-07-06

新闻发布系统模板javaee

一个很不错的新闻发布系统的模板,所应用的技术还算是比较新的,javaee开发的

2015-06-11

随机森林最原始的论文

最原始的随机森林论文,被引用次数高达5000+

2015-06-06

爬虫程序 可以运行的

写的一个小小的爬虫,因为课程需要而写的,现在贡献给大家

2015-05-18

机器学习与模式识别 完整清晰中文版 PRML 之作

PRML 大神之作,伯克利教授的中文版终于来了。

2015-05-14

csharp基本技术制作的小bbs

一个简单的c#制作的bbs,虽然很简单,但是基本功能都具备了,希望可以帮到你。

2015-03-01

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除