关闭

全机器学习和Python的27个速查表(完整版)

转自:http://www.sohu.com/a/157941537_642762 机器学习(Machine Learning) 有不少有用的流程图和机器学习算法表。 这里只包括所发现的最全面的速查表。 神经网络架构(NeuralNetwork Architectures) 来源:http://www.asimovinstitute.org/neural-network-z...
阅读(25) 评论(0)

MAC El Capitan以上版本安装cx_Oracle

其实安装的步骤是非常简单的,按照其他博客的安装: http://thelaziestprogrammer.com/sharrington/databases/oracle/install-cx_oracle-mac 你可以很快的完成。但我的版本是MacOs Sierra,无论怎么安装死活都是:Traceback (most recent call last): File ""...
阅读(28) 评论(0)

如何选择机器学习算法的简单线路图

这个线路图来自于scikit-learn,分享之:...
阅读(28) 评论(0)

Spring @Schedule Annotation详解

1. Overview 这篇文章中我们将讨论Spring的@Scheduled annotation,并且,将展示如何用它来配置一个定时任务。 要使用@Scheduled annotation有两条基本的原则: a method should have void return typea method should not accept any parameters 2. ...
阅读(213) 评论(0)

深入解释Java7中运行UT的OutOfMemoryError: PermGen space

一组UT代码,在经过一段时间的修改和膨胀之后,“突然”某一天在运行的时候抛出了OutOfMemoryError: PermGen space异常,导致无法运行,你想想不到用了Mockito或PowerMock之后内存开销会有多大...
阅读(352) 评论(0)

Hadoop streaming详解

Hadoop streamingHadoop为MapReduce提供了不同的API,可以方便我们使用不同的编程语言来使用MapReduce框架,而不是只局限于Java。这里要介绍的就是Hadoop streaming API。Hadoop streaming 使用Unix的standard streams作为我们mapreduce程序和MapReduce框架之间的接口。所以你可以用任何语言来编写MR...
阅读(2753) 评论(0)

MapReduce基础

这篇文章翻译自Yahoo的Hadoop教程,很久之前就看过了,感觉还不错。最近想总结一下以前学的东西,看到现在关于Hadoop的中文资料还比较少,就有了把它翻译出来的想法,希望能帮助到初学者。这只是Yahoo的Hadoop教程中很小的一部分,我下去还会选一些来翻译,一般来说只翻译讲原理的,操作类的就不翻译了。水平有限,不妥之处,请指正(感觉翻译过来后,读起来倒是没英文的顺畅:)。废话说完,正文开始...
阅读(367) 评论(0)

Amazon Dynamo论文中文版

原著: Werner Vogels 翻译: quest.run   (翻译本文,旨在讨论NoSQL时会有一个共同的Terminology,对于要实现NoSQL方案的同学,建议啃啃原文,因为很多术语在翻译成中文后语义差异很大,如quorum, replica/replication, read-repair, anti-entropy, partition/partitionin...
阅读(805) 评论(0)

使用sqoop导入postgresql数据到Hbase

随着业务和大数据技术的发展,越来越多的公司需要在后端架设Hbase数据库,而原有的业务则需要从各种RDBMS数据库中迁移到Hbase当中。Appach的sqoop(发音:[skup])就是基于这样的需求而诞生的,本文详细记录了一个通过sqoop将数据从postgresql迁移到Hbase,并定制row key的例子。...
阅读(760) 评论(0)

Elasticsearch之基本操作

摘要: 本文简单介绍了elasticsearch的HTTP API中的插入、删除、更新、查找、搜索功能。 elasticsearch是一个是开源的(Apache2协议),分布式的,RESTful的,构建在Apache Lucene之上的的搜索引擎。 它有很多特点例如Schema Free,Document Oriented。它是#nosql的,基于JSON,同...
阅读(843) 评论(0)

用postman快速学习ElasticSearch的搜索功能

在初步学习ElasticSearch的时候,我们大部分的时候需要通过其REST API去熟悉ES的功能,但如果只是用curl命令,不免麻烦而不直观,如果使用postman, 我们就可更好的归纳,分类和复用各种API...
阅读(1818) 评论(1)

ELASTICSEARCH集群部署

ELASTICSEARCH集群部署文档 ElasticSearch集群部署文档 版本及连接系统要求部署 1. 确认JDK版本及安装2. 下载es3. 用户/目录/权限设置5. 切换用户6. 修改配置文件7. 设置es占用内存8. 启动测试9. 正式启动10. 脑裂 官方es搭建步骤写的很简略, 但是实际搭建过程中, 会涉及一系列环境配置. 以下的流程, 是在...
阅读(750) 评论(0)

详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改...
阅读(1013) 评论(0)

Maven生成可以直接运行的jar包的多种方式

Maven可以使用mvn package指令对项目进行打包生成jar文件,如果直接使用java -jar xxx.jar指令运行jar文件,会出现”no main manifest attribute, in xxx.jar”(没有设置Main-Class)、ClassNotFoundException(找不到依赖包)等错误。 要想jar包能直接通过java -jar xxx.jar运行,需要满...
阅读(968) 评论(0)

CAP, BASE, 最终一致性和五分钟原则

CAP,BASE和最终一致性是NoSQL数据库存在的三大基石。而五分钟法则是内存数据存储的理论依据。这个是一切的源头。 CAP     C: Consistency 一致性A: Availability 可用性(指的是快速获取数据)P: Tolerance of network Partition 分区容忍性(分布式)   10年前,Eric Bre...
阅读(771) 评论(0)
87条 共6页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:389063次
    • 积分:3691
    • 等级:
    • 排名:第8827名
    • 原创:54篇
    • 转载:31篇
    • 译文:2篇
    • 评论:37条
    最新评论