大数据
文章平均质量分 60
大数据分析BDA
Python及机器学习分享
展开
-
【学习】数据分析与挖掘的相关书籍
算法方法类:(1)统计学习方法(2)数据挖掘导论(3)集体智慧编程(4)推荐系统实践(5)深入浅出数据分析(6)Machine Learning(7)Machine Learning in Action(8)Machine Learning for Hackers(9)Convex Optimization(10)Probabilistic Graphica原创 2014-09-04 23:21:20 · 1842 阅读 · 0 评论 -
【学习】大数据是什么
数据伴随人类社会一直存在着,大数据到底指什么,与我们有什么关系,我们该如何利用。相对人类社会,超过当时社会处理能力的数据就是大数据。目前,大数据应用比较成熟的领域如:互联网广告营销、互联网金融和机器翻译等。大数据应用面临的挑战之一隐私保护,大数据强调符号化和用户特征,而不是个体隐私信息。大数据专家维克托《删除》中表示,对人类而言,遗忘一直是常态,而记忆才是例外。大量数字化的个人信息将可能在原创 2014-09-05 23:21:38 · 1977 阅读 · 0 评论 -
【学习】Hadoop概念及使用案例
Hadoop是一个实现了mapreduce 模式的开源的分布式并行编程框架。mapreduce模式的主要思想是将自动分割要执行的问题拆解成map(映射)和reduce(化简)的方式。原创 2014-09-11 21:55:40 · 963 阅读 · 0 评论 -
【学习】大数据成熟度模型
大数据成熟度模型可用来描述企业使用大数据的阶段或企业与大数据的集成程度。原创 2014-09-11 21:58:04 · 4808 阅读 · 0 评论 -
【学习】数据挖掘准则
数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。原创 2014-09-11 21:58:13 · 1040 阅读 · 0 评论 -
【OpenStack】OpenStack原理(一)——OpenStack发展及架构
OpenStack目前的七个核心组件,分别是计算(Compute)、对象存储(Object Storage)、认证(Identity)、用户界面(Dashboard)、块存储(Block Storage)、网络(Network)和镜像服务(Image Service)。原创 2016-04-17 15:42:14 · 24496 阅读 · 0 评论 -
【OpenStack】OpenStack原理(二)——开发基础
OpenStack使用Jenkins搭建自己的持续集成服务器。Jenkins背后需要依托大量的单元测试以及集成测试代码,单元测试的代码位于各个项目自身的源码树里,而OpenStack的集成测试则是使用Tempest作为框架。原创 2016-04-17 21:23:47 · 1989 阅读 · 0 评论 -
大数据存储综述
本文内容源自网络整理,更多详细内容请阅读参考文献的原文。1 存储方式1.1 块存储块存储就好比硬盘一样,直接挂载到主机,一般用于主机的直接存储空间和数据库应用的存储。它分两种形式:DAS:一台服务器一个存储,多机无法直接共享,需要借助操作系统的功能,如共享文件夹。SAN:金融电信级别,高成本的存储方式,涉及到光纤和各类高端设备,可靠性和性能都很高,除了贵和运维成本高,基本都是好处。云存储的块存储:...原创 2018-04-01 14:57:08 · 16444 阅读 · 1 评论