Data
文章平均质量分 84
先知摩西
愿历尽千帆,归来仍少年!
展开
-
数据科学简介,第 1 部分 数据、结构和数据科学管道
数据是一种商品,但是,如果无法处理数据,数据的价值就值得怀疑。数据科学是一个多学科领域,其目的是从所有形式的数据中提取价值。本文从数据、数据结构以及可用于将数据转换为价值的高级流程方面来探讨数据科学领域。数据科学是一个流程。这并不是说数据是机械的,缺乏创造力的。但是,当您深入到数据处理的各个阶段,从再加工数据源和清理数据到机器学习及最终的可视化,您就会看到将原始数据转换为洞察过程中涉及到一些独...转载 2018-08-17 11:41:00 · 311 阅读 · 0 评论 -
数据科学简介,第 2 部分 通过对数据分类进行预测
您可以从原始数据提取出的一种关键价值是,能够构建一个可用于预测或分类的模型。应用此模型,您可以将观察值转换为具有明显价值的预测或分类。本教程延续了第 1 部分:“数据、结构和数据科学管道”中引入的原则,探讨两种使用监督学习和无监督学习的分类方法(一种预测形式)。分类是机器学习算法的一种常见应用。您可以使用监督学习来实现预测和分类,使用以前的观察值构建一个模型,以便根据未见过的观察值来预测结果。...转载 2018-08-17 11:42:49 · 364 阅读 · 0 评论 -
数据科学简介,第 3 部分 文本分析
数据科学在数值领域中很常见,但这个不断壮大的领域现在也可以应用于非数值数据,比如文本。本教程将探索一些理解文本数据的关键算法,包括基本文本分析、马尔可夫链和情感分析。数据科学简介,第 1 部分:“数据、结构和数据科学管道”探索了各种类型的数据,并展示了如何从中提取价值。但是,不是所有数据都是结构化的,并具有容易处理的格式。一些数据(比如文本)是非结构化的,需要采用不同的机制来提取洞察。文本分析...转载 2018-08-17 11:44:08 · 1421 阅读 · 0 评论 -
数据科学简介,第 4 部分 数据科学语言
编程语言和环境为解决问题奠定了基础,但并非所有语言都生来平等。C 和 C++ 语言通常用于高性能数据分析,而 Python 之类的语言则可以帮助程序员更加富有成效地解决眼前的问题。大数据处理具有自己的框架和语言,科学语言也是一样。本文探讨用于数据科学领域的一些关键语言以及它们的优势。从实际来看,任何编程语言都可用于数据科学。但是,一些语言在这个领域会比其他语言更为实用。事实上,人们发现某些语言...转载 2018-08-17 11:45:23 · 381 阅读 · 0 评论 -
数据如何变成知识,第 1 部分 从数据到知识
过去几年,信息科学取得了重大进展。随着本地服务器给云服务让道,SQL 数据库和数据表开始朝 NoSQL 和键值对数据存储迁移。随后,为了处理大量的、品种繁多的、快速生成的数据,大数据和相关的扩展技术应运而生。DIKW 模型数据:数据是事实、信号或符号的集合。在这种形式下,数据可能是原始、不一致或杂乱的。因此,这种数据没有用。 信息:信息是按一致的方式整理和排序的数据集合。信息形式的数据变...转载 2018-08-17 16:22:46 · 4083 阅读 · 0 评论 -
数据如何变成知识,第 2 部分 数据湖和数据沼泽
数据湖概念已存在多年。它最初引起了一些争议,而且被贴上了营销炒作的标签。术语数据湖不是任何传统数据存储架构的一部分,所以供应商可以自由地使用它来表示许多不同的事物。数据存储术语,比如流、池、储备库和云,在数据科学中也得到广泛使用。不可避免地,人们开始将其与天然水生态系统进行类比,所以现在我们还有了数据湖和数据沼泽。类比对解释概念很有帮助,但始终存在着过度类比导致失败的危险。如果您是该领域的...转载 2018-08-17 16:24:14 · 1277 阅读 · 0 评论 -
数据如何变成知识,第 3 部分 提取暗数据
在我的上一篇文章中,您了解了数据湖如何允许存储大量多格式数据,从而帮助加速数据摄入和降低摄入成本。廉价存储技术的出现,使组织能更轻松、更便宜地存储大量数据。组织存储数据有许多原因,通常是为了保留记录和遵守法规。不幸的是,许多公司从未使用他们存储的哪怕一小部分数据,而且良好数据可能无法访问,因为存储储备库没有恰当地对元数据标签进行归档,集成的工具无法读取某些数据格式,或者该数据无法通过查询来检索...转载 2018-08-17 16:25:09 · 365 阅读 · 0 评论 -
漫画:什么是大数据?
大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。Big data is high volume, high velocity, and/or high variety information assets that require new forms of processing to enable enhanced decision...转载 2018-08-20 18:12:05 · 681 阅读 · 0 评论 -
Redis 集群部署及踩过的坑
本文目标要在单台机器上搭建Redis集群,方式是通过不同的TCP端口启动多个实例,然后组成集群,同时记录在搭建过程中踩过的坑。安装准备centos版本:6.7redis版本:3.2.3安装方式:源码安装服务器:1台操作步骤此处默认已安装好单台redis,如果不会可以参照《centos上安装redis》 1、启动Redis多个实例我们在Redis安...原创 2018-08-20 18:21:41 · 609 阅读 · 0 评论