算法
Yoga-jiang
在晶赞从事大数据研发工作
展开
-
几种算法的C实现
排序算法总结 1.插入排序 一般来说,插入排序 都采用in-place在数组上实现。具体算法描述如下:从第一个元素开始,该元素可以认为已经被排序取出下一个元素,在已经排序的元素序列中从后向前扫描如果该元素(已排序)大于新元素,将该元素移到下一位置重复步骤3,直到找到已排序的元素小于或者等于新元素的位置将新元素插入到该位置中重复步骤2如果比较操转载 2014-05-26 17:55:53 · 680 阅读 · 0 评论 -
hive-学习内容
1 hive的正则匹配搜索表 show table原创 2014-09-18 10:26:33 · 479 阅读 · 0 评论 -
hive 基础内容
(一): Hive 是什么 在接触一个新的事物首先要回到的问题是:这是什么? 这里引用 Hive wiki 上的介绍: Hive is a data warehouse infrastructure built on top of Hadoop. It provides tools to enable easy data ETL, a mechanism to put转载 2014-08-29 11:18:26 · 445 阅读 · 0 评论 -
linux远程下载文件 的两种方法之 ftp命令和scp命令
ftp命令: 服务器有安装ftp Server,另外一台linux可以使用ftp的client程序来进行文件的拷贝读取和下载。 1. 连接ftp服务器 格式:ftp [hostname| ip-address] a)在linux命令行下输入:ftp 192.168.26.66 b)服务器询问你用户名和口令,分别输入用户名和相应密码,待认证通过即可。 2. 下载文件转载 2014-09-03 09:57:57 · 2341 阅读 · 0 评论 -
安装numpy+scipy+matlotlib+scikit-learn及问题解决
这篇文章主要讲述Python如何安装Numpy、Scipy、Matlotlib、Scikit-learn等库的过程及遇到的问题解决方法。最近安装这个真是一把泪啊,各种不兼容问题和报错,希望文章对你有所帮助吧!你可能遇到的问题包括:ImportError: No module named sklearn 未安装sklearn包 ImportError: DLL load failed: 找不到指定转载 2017-03-20 17:54:08 · 977 阅读 · 0 评论 -
下一代Apache Hadoop MapReduce框架的架构
背景随着集群规模和负载增加,MapReduce JobTracker在内存消耗,线程模型和扩展性/可靠性/性能方面暴露出了缺点,为此需要对它进行大整修。需求当我们对Hadoop MapReduce框架进行改进时,需要时刻谨记的一个重要原则是用户的需求。近几年来,从Hadoop用户那里总结出MapReduce框架当前最紧迫的需求有:(1)可靠性(Reliability)– JobTracker不可靠(转载 2017-04-05 10:09:13 · 683 阅读 · 0 评论