- 博客(10)
- 资源 (1)
- 收藏
- 关注
转载 ElasticSearch的Gateway及存储原理
转自:http://log.medcl.net/item/2010/10/elasticsearch-the-gateway-and-storage/ES里有一个叫做gateway的东西,今天抽空理一下,前面翻译ES的一篇博文叫做“搜索引擎与时间机器”,既然里面谈到了时间机器,就免不了需要穿越时空的的门咯,I guess,也许gateway这名字就是这么来的,其实在ES里面,gatew
2016-05-19 13:12:58 38337
转载 Elasticsearch与Solr对比
转自:http://i.zhcy.tk/blog/elasticsearchyu-solr/搜索引擎选型调研文档Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个
2016-05-19 13:10:18 951 1
原创 设计模式(一)-- 工厂模式
一、概念简单工厂提供创建对象实例的功能,而无需关心起具体实现。简单工厂方法的内部主要实现的功能是:选择合适的实现类来创建实例对象。而不是通过构造方法来进行创建对象实例,而是通过一个产生对象实例的工厂来创建对象实例。二、结构图三、具体代码实现参见github:https://github.com/asiacui/DesignModel/tree/m
2016-05-19 13:03:28 524
转载 一文读懂机器学习
从机器学习谈起 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于
2016-05-18 09:00:25 1137 1
原创 ElasticSearch之Java Api聚合分组实战
转自:http://qindongliang.iteye.com/blog/2289590#rd最近有个日志收集监控的项目采用的技术栈是ELK+JAVA+Spring,客户端语言使用的是Java,以后有机会的话可以试一下JavaScript+Nodejs的方式,非常轻量级的组合,只不过不太适合服务化的工程,Kibana充当可视化层,功能虽然非常强大和灵活,但是需要业务人员懂Lucene的查询语
2016-05-11 19:39:33 21834 2
转载 大数据学习资源汇总
当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。为了帮助大家更好深入了解大数据
2016-05-06 14:46:56 1956
转载 数据库的原理(二)
全局概览我们已经了解了数据库内部的基本组件,现在我们需要回来看看数据库的全貌了。数据库是一个易于访问和修改的信息集合。不过简单的一堆文件也能达到这个效果。事实上,像SQLite这样最简单的数据库也只是一堆文件而已,但SQLite是精心设计的一堆文件,因为它允许你:使用事务来确保数据的安全和一致性快速处理百万条以上的数据数据库一般可以用如下图形
2016-05-06 09:09:31 655
转载 数据库的原理(1)
一提到关系型数据库,我禁不住想:有些东西被忽视了。关系型数据库无处不在,而且种类繁多,从小巧实用的 SQLite 到强大的 Teradata 。但很少有文章讲解数据库是如何工作的但少有文章讲解数据库是如何工作的。你可以自己谷歌/百度一下『关系型数据库原理』,看看结果多么的稀少。难道关系型数据库已经太古老太无趣,除了大学教材、研究文献和书籍以外,没人愿意讲了吗?作为一个开发人
2016-05-06 09:08:24 568
原创 java 集合类Array、List、Map区别和联系
Java集合类主要分为以下三类:第一类:Array、Arrays第二类:Collection :List、Set第三类:Map :HashMap、HashTable 一、Array , ArraysJava所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。1、效率高,但容量固定且无法动态改变。array还有一个缺点是,无
2016-05-05 11:09:11 560
原创 spark rdd
RDD是弹性分布式数据集,即一个RDD代表一个被分区的只读数据集。一个RDD生成有两种途径,一个来自于内存集合和外部存储系统,另一种是通过转换操作来自于其他RDD,比如:map、filter、jion等。 RDD分区:对于一个RDD而言,分区的多少代表着对这个RDD进行并行计算的粒度,每一个RDD分区的计算操作都在一个单独的任务中被执行。对于分区的多少用户可以自己指定,如果没有指定将会使
2016-05-03 17:50:02 810
centos7.6机器上离线安装docker-ce-19.03、nvidia-docker2
2023-11-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人