自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

kindy的开发工作室

java ,PHP,NoSql,搜索,j2ee,系统架构

  • 博客(6)
  • 资源 (33)
  • 收藏
  • 关注

转载 熟悉 MongoDB MapReduce

MongoDB资料汇总专题  http://blog.nosqlfan.com/html/3548.html MapReduce MapReduce是一种计算模型,简单的说就是将大批量的工作(数据)分解(MAP)执行,然后再将结果合并成最终结果(REDUCE)。这样做的好处是可以在任务被分解后,可以通过大量机器进行并行计算,减少整个操作的时间。 对科班出生的程序员来

2011-12-28 15:26:25 471

转载 NoSQL数据库:MongoDB初探

跟着时下炒得火热的NOSQL潮流,学习了一下mongodb,记录在此,希望与感兴趣的同学一起研究! MongoDB概述 mongodb由C++写就,其名字来自humongous这个单词的中间部分,是由10gen开发并维护的,关于它的一个最简洁描述为:scalable, high-performance, open source, schema-free, document-orie

2011-12-28 15:18:51 569

转载 一淘网技术简介

一淘网( www.etao.com )于2010年10月9日10:39正式上线,很多同学和同行对一淘的系统架构和面临的关键技术问题都很感兴趣,这篇短文希望能给予简要的介绍。 系统架构 一淘的系统架构如上图所示。可以看到,一淘有三个数据来源:互联网、外部合作方和淘宝主站。其中,互联网数据通过crawl的方式获得,而后两者则通过feed的方式提供。 抓取系统的功能包括

2011-12-28 15:05:37 800

转载 快速构建实时抓取集群

定义: 首先,我们定义一下定向抓取,定向抓取是一种特定的抓取需求,目标站点是已知的,站点的页面是已知的。本文的介绍里面,主要是侧重于如何快速构建一个实时的抓取系统,并不包含通用意义上的比如链接分析,站点发现等等特性。 在本文提到的实例系统里面,主要用到linux+mysql+redis+django+scrapy+webkit,其中scrapy+webkit作为抓取端,re

2011-12-28 14:57:51 460

原创 使用mongodb 的MapReduce功能笔记

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。 1.  先来一个看一个简单的例子,利用mongodb 的MapReduce功能进行分组统计。 数据表结构,用户的行为Record表,用户每个行为记录一条,利用MapReduce来统计每个用

2011-12-28 14:44:36 562

转载 解决“/bin/bash^M: bad interpreter: No such file or directory

在網上找到一個腳本,將其上傳至linux上進行編譯測試時報錯:“/bin/bash^M: bad interpreter: No such file or directory 查詢後得知,可能是Windows 與 linux的編碼格式不一樣不致。     於時透過如下命令對文件编码方式進行转变。 [root@localhost bin]# dos2unix myshell.sh

2011-12-20 19:07:37 540

PHP5学习教程

PHP5学习教程PHP5学习教程

2008-03-07

HTML+CSS帮助手册

HTML+CSSHTML+HTML+CSS帮助手册

2008-03-07

asp中文帮助手册

asp中文帮助手册aspasp

2008-03-07

ADO中文帮助手册

ADO中文帮助手册ADO中文帮助手册

2008-03-07

XML官方指南中文版

XML官方指南中文版XML

2008-03-07

Linux 命令全集

Linux 命令全集Linux 命令全集

2008-03-07

图书馆管理系统源代码(j2ee技术)

真实案例,重要资源,是您学习j2ee的很好的参考

2008-03-07

SQL语法教程

SQL语法教程SQL语法教程

2008-03-07

Jboss 下开发EJB简介

Jboss 下开发EJB简介

2008-03-07

UML参考手册

UML参考手册UML参考手册

2008-03-07

JSP数据库编程指南

JSP数据库编程指南JSP数据库编程指南

2008-03-07

StrutsInAction中文

Eclipse中文教程Eclipse中文教程

2008-03-07

JSP参考手册

JSP参考手册JSP参考手册

2008-03-07

JBoss架构分析

实用J2EE设计模式编程指南

2008-03-07

用 J2EE 和 UML 开发 Java 企业级应用程序

用 J2EE 和 UML 开发 Java 企业级应用程序

2008-03-07

ROSE培训教材中文简版

ROSE培训教材中文简版

2008-03-07

分布式系统设计

分布式系统设计分布式系统设计

2008-03-07

正则表达式简介

正则表达式简介\正则表达式简介

2008-03-07

用 JDBC 管理数据库连接

用 JDBC 管理数据库连接

2008-03-07

连接池例子

连接池例子ConnectionPool

2008-03-07

PERL语言编程

PERL语言编程PERL语言编程

2008-03-07

EJB3基础

EJB3基础EJB3基础

2008-03-07

LuceneInAction中文版

LuceneInAction中文版

2008-03-07

Deep Web 数据集成问题研究

Deep Web 数据集成问题研究

2008-03-07

JSTLExample 例子

JSTLExample 例子

2008-03-07

ibatis 开发指南

ibatis 开发指南

2008-03-07

webwork2

webwork2学习

2008-03-07

探讨Struts的初始化方法

探讨Struts的初始化方法

2008-03-07

Struts快速学习指南

Struts快速学习指南

2008-03-07

Struts原理与实践

Struts原理与实践,我也不想要大家的分,我实在是没分了。谢谢

2008-03-07

JTree

动态树,实在不好意思,我没有分了,下不了资源了,<br>想让大家多支持,请谅解

2008-01-04

hibernate中文参考文档

hibernate中文参考文档 开发者必备

2007-08-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除