关闭

干货!(Java)线程通信

线程通信的目标是使线程间能够互相发送信号。另一方面,线程通信使线程能够等待其他线程的信号。 例如,线程B可以等待线程A的一个信号,这个信号会通知线程B数据已经准备好了。本文将讲解以下几个JAVA线程间通信的主题: 1、通过共享对象通信 2、忙等待 3、wait(),notify()和notifyAll() 4、丢失的信号 5、假唤醒 6、多线程等待相同信号 7、不要对常量字符串...
阅读(1) 评论(0)

超级干货 :一文读懂大数据处理框架

说起大数据处理啊,一切都起源于Google公司的经典论文。在当时(2000年左右),由于网页数量急剧增加,Google公司内部平时要编写很多的程序来处理大量的原始数据:爬虫爬到的网页、网页请求日志;计算各种类型的派生数据:倒排索引、网页的各种图结构等等。这些计算在概念上很容易理解,但由于输入数据量很大,单机难以处理。所以需要利用分布式的方式完成计算,并且需要考虑如何进行并行计算、分配数据和处理失败...
阅读(2) 评论(0)

实时计算工具库 stream-lib 使用指南

进行大数据处理时,计算唯一值、95% 分位数等操作非常占用空间和时间。但有时我们只是想对数据集有一个概略的了解,数值的准确性并不那么重要。实时监控系统中也是如此,可以容忍一定的错误率。目前已经有许多算法可以通过牺牲准确性来减少计算所需的空间和时间,这些算法大多支持数据结构之间的合并,因此可以方便地用在实时计算中。stream-lib 就是一个集成了很多此类算法的实时计算工具库,是对现有研究成果的 ...
阅读(3) 评论(0)

22个免费的数据可视化和分析工具推荐

作者:老枪   本文总结推荐22个免费的数据可视化和分析工具。列表如下:   数据清理(Data cleaning)   当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City” ,同时其他人会说”New York, NY” 。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于上佳...
阅读(2) 评论(0)

Elasticsearch.5.4.1+kibana5.4.1+IK分词集群搭建

报错问题解决 es安装过程中可能会遇到以下错误,对应解决方案 错误1:max file descriptors [4096] for elasticsearch process likely too low, increase to at least [65536] 修改: /etc/security/limits.conf * hard nofile ...
阅读(1) 评论(0)

机器学习实战-数据探索(缺失值处理)

为什么需要处理缺失值呢? 训练数据集中缺少的数据可以减少模型的拟合,或者可能导致模型偏差,因为没有正确地分析变量的行为和关系,可能导致错误的预测或分类。 Data_Exploration_2_11.png 注意上图中缺失值:在左侧的情况下,没有处理缺失值, 男性打板球的机会高于女性。 另一方面,如果看看第二个表,其中显示了处理缺失值后的数据(基于性别),我们可以看到女性与男性...
阅读(2) 评论(0)

如何成为一名顶级战斗力的数据分析师?

不知道大家以前听没听说过“10x Developer”这个词,如果你连听都还没听说过,那可真是时候考虑放弃自己的程序猿事业了。就像传说一样,一些程序猿的战斗力能达到同行的10倍,也就是说一个10x程序猿能够替换一个10人的开发团队。 本篇文章我们就针对数据科学,来谈一谈如何才能成为一名传说中的10x老司机。本文作者主要从事数据挖掘及处理方面的开发工作,是西雅图女性程序员俱乐部PyLadies...
阅读(7) 评论(0)

大数据架构详解:从数据获取到深度学习

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其专门研究计算机是怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。此外,数据挖掘和机器学习有很大的交集。本文将从架构和应用角度去解读这两个领域。 机器学习和数据挖掘的联系与区别 数据挖掘是从海量...
阅读(1) 评论(0)

Java数据结构与算法解析(六)——AVL树

之前我们说过普通二叉查找树的删除算法会使得左子树比右子树深,因为我们总是用右子树的一个来代替删除的节点。会造成二叉查找树,严重的不平衡。 AVL树简介 而AVL树就是解决普通二叉查找树弊端的方法,他是带有平衡条件的二叉查找树,这个平衡条件必须容易保持,而且它保证树的深度必须是O(logN). AVL树是高度平衡的而二叉树。它的特点是:AVL树中任何节点的两个子树的高度最大差别为1...
阅读(2) 评论(0)

Java 9 正式发布,终落地 Jigsaw 项目

9 月 21 日,大家期待已久的 Java 9 终于正式发布了,本文与大家一起快速回顾一下 IntelliJ IDEA 中 Java 9 的支持,并了解 IntelliJ IDEA 2017.3 中针对 Java 9 的推出的新功能。 Jigsaw 和 JPMS 提及 Java 9,最大的功能莫过于 Jigsaw 项目下的核心 Java 平台模块化系统(JP...
阅读(1) 评论(0)

OpenStack大规模部署详解 Ocata

走过了7年的发展岁月的OpenStack已经成为了云计算领域中最火热的项目之一,并逐渐成为IaaS的事实标准,私有云项目的部署首选。OpenStack社区可能自己都没有想到其发展会如此之迅速,部署规模如此之大,以至于最开始对大规模OpenStack集群的部署支持以及持续可扩展性似乎并没有考虑完备。众所周知,OpenStack每一个项目都会有数据库的访问以及消息队列的使用,而数据库和消息队列是整个O...
阅读(14) 评论(0)

Java I/O

I/O,即 Input/Output(输入/输出) 的简称。就 I/O 而言,概念上有 5 种模型:blocking I/O,nonblocking I/O,I/O multiplexing (select and poll),signal driven I/O (SIGIO),asynchronous I/O (the POSIX aio_functions)。不同的操作系统对上述模型支持不同,...
阅读(21) 评论(0)

Amazon Aurora深度探索(二)

Aurora的存储架构 存储层的设计和实现,体现了“the log is the database”,其含义是日志中包含了数据的信息,可以从日志中恢复出用户的数据,所以数据不一定必须再独立存储一份。而数据库的核心不仅是数据,保障数据的拥有ACID特性的事务和提供便捷查询的SQL语句,对以数据为基础提供商业的交易服务更是必不可缺,所以更精确的说,“the log is the data”,日志...
阅读(32) 评论(0)

开车最怕这些视野盲区 给你破解答案

我们在开车的时候   总会出现视野盲区   什么是视野盲区?   视野盲区就是汽车驾驶人员坐在驾驶室内时,   视线受到遮挡,   无法直接看到的车辆外部的区域。   ▼   在视野盲区里的障碍物,   无论是静止的,还是活动的,驾驶人员都是看不到的。   所以,这些盲区就需要我们特别的注意,   因为一个不小心就可能导致交通事故...
阅读(9) 评论(0)

大数据时代结构化存储云HBase技术架构及最佳实践

摘要: 本文中,阿里云高级专家封神带来了主题演讲《大数据时代结构化存储云HBase技术架构及最佳实践》,介绍HBase的应用选择、实战案例、技术平台解读以及后续的规划。 在10年,阿里研究HBase,是为了解决阿里容量及并发的实际问题,按照数据库要求,阿里深入HBase技术,并致力于保障稳定性和性能,目前已经有10000台规模,数百个集群,大约1亿的QPS,服务整个集团的业务。17年,把这部...
阅读(56) 评论(0)
620条 共42页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:48434次
    • 积分:6334
    • 等级:
    • 排名:第4224名
    • 原创:562篇
    • 转载:8篇
    • 译文:0篇
    • 评论:12条
    文章分类
    文章存档
    最新评论