- 博客(44)
- 资源 (30)
- 收藏
- 关注
原创 SQL SERVER 2008讲座
<br />前几天听了听SQL SERVER 2008的讲座,感觉讲的比较好,自己问了几个问题,比较明白,现在记录一下当时自己问的问题:<br />(1)数据库分区,设计数据表的分区要在建表之前就设计好,假如一个数据表数据会很大,就像订单式的数据,最好按照分区设计表,不然以后很难扩展<br />(2)数据冗余与查询效率,两个表连接查询肯定比不上在一个表里查询块了,但是若把一些数据放到一张表里,这张表里的数据势必会有冗余。但是查询会块,更新,删除操作会慢一点。范式越高,冗余度越小,一般,实际设计时并不追求高范
2011-04-02 22:07:00 1175
原创 Hadoop TeraSort 基准测试实验
<br /><br />Author: zhankunlin<br />Date: 2011-4-1<br />Key words: Hadoop, TeraSort<br /> <br /><一> TeraSort 介绍<br />1TB排序通常用于衡量分布式数据处理框架的数据处理能力。Terasort是Hadoop中的的一个排序作业,在2008年,Hadoop在1TB排序基准评估中赢得第一名,耗时209秒。<br /><二> 相关资料<br />Hadoop MapReduce扩展性的测试: http
2011-04-01 20:16:00 16537 4
原创 使用 ctags 和 vim 插件 taglist 阅读C和C++源码
源码根目录是: /local/zkl/Datacollectorctags -R * 生成tags文件vim Parapi.cset tags=/local/zkl/Datacollector/tagsctrl+] 进入函数定义处ctrl+T 退回来或者 vim ~/.vimrc :set tags=./tags在源码根目录生成tags,然后在根目录 vim Parapi/parapi.c 编辑代码,这将载入根目录下生成的ctags
2011-04-01 20:16:00 1944
原创 基于Hadoop的数据挖掘项目mahout的源码编译
<br /><br />前提: 机器能联网<br />(1) 用SVN下载Mahout最新源码,check out http://svn.apache.org/repos/asf/mahout/trunk<br /> 注: 发行版源码在 http://archive.apache.org/dist/mahout/ 下<br />(2) 下载 maven,这里下载二进制版本的 maven-3.0.3,在 http://archive.apache.org/dist/maven/binaries/ 中下载
2011-04-01 20:15:00 5428 1
Organizing Business Knowledge The MIT Process Handbook
2014-10-08
Oracle 11g R2 for Linux X64 OCCI
2011-12-07
Linux下Hadoop分布式配置和使用
2010-05-28
Ubuntu 8.10下Hadoop-0.20.1集群配置详细手册
2010-03-25
wamp server 5集成开发环境
2009-12-04
【server 2003系统下】Eclipse下实现Java和sql server/Oracle连接详细步骤说明
2009-04-10
C#最长匹配算法切词程序(信息检索)
2009-04-10
基于asp+Access的大中型论坛
2009-04-10
ETL过程概念建模好资料
2009-04-04
基于UML的ETL过程建模方法
2009-04-03
基于.NET的网上电子商城
2009-03-23
基于vb6.0+sql server 2000 的图书管理系统
2009-02-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人