![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据应用
文章平均质量分 57
iteye_19740
这个作者很懒,什么都没留下…
展开
-
大数据最清楚王宝强离婚事件到底有多热!
8月14日凌晨的微博被王宝强离婚的事件给爆了,那天晚上整个娱乐圈记者和广大夜猫子网友肯定都没睡好觉。这件事经过持续发酵9个小时后,大数据给出了一份结果,可以证明王宝强离婚事件到底有多热王宝强离婚时间,9个小时后:1、王宝强近24小时热议度309304较昨日同期增长20348%。—来自:微博指数;2、根据新浪CEO提供的数据显示:王宝强发布微博一个小时后,QPS(每秒查询率,即...原创 2016-08-16 10:00:02 · 140 阅读 · 0 评论 -
IBM SPSS Modeler数据库内建模
IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数...2016-09-29 11:08:35 · 257 阅读 · 0 评论 -
拥抱开源 - 云上元数据管理
上期我们讲述的是实现数据工程师梦想的一个小目标《梦想成真,只差一步》,里面提到了要实现数据超市的管理,数据工程师需要使用合适的工具将数据进行整理、组合、分类后上架,然后业务分析师和数据科学家就可以使用了。在整个数据工程师的工作流程中,需要自始至终的进行数据治理:我们需要将每种类型的数据进行清晰的标识以及分类,以利于其它角色的用户进行查找以及使用;我们需要将每种数据的使用范围进行管理以及监...2016-09-30 10:50:47 · 375 阅读 · 0 评论 -
10大天然大数据公司,看他们如何挖掘数据价值
1、亚马逊的“信息公司” 亚马逊要处理海量数据,交易数据的直接价值很大。作为一家“信息公司”,亚马逊从每个用户的购买行为中获取信息,将用户在网站上的行为记录下来,页面停留时间、用户查看评论、搜索关键词、浏览商品等。亚马逊对数据价值的敏感和重视及挖掘能力,使它远超传统运营方式。2、谷歌“意图” 准确定义“大数据”概念的科技公司非谷歌莫属。根据搜索研究机构的数据,仅1个月...2016-10-10 14:03:50 · 161 阅读 · 0 评论 -
Apache Hadoop 3.0新版本介绍及未来发展方向(内附PDF)
本文PPT来自 Hadoop研发工程师张喆、陈霄讲《Apache Hadoop 十周岁展望前方》在Strata + Hadoop World2016会议上的分享。过去十年,Apache Hadoop从无到有,从理论概念演变到如今支撑起若干全球最大的生产集群。接下来的十年,Hadoop将继续壮大,并发展支撑新一轮的更大规模、高效和稳定的集群。 我们此次将向大家全面介绍即将到来的Apache H...2016-10-11 11:04:32 · 223 阅读 · 0 评论 -
InfoSphere Streams——实时大数据分析平台
了解 InfoSphere Streams,它是 IBM 大数据平台的一部分。InfoSphere Streams 解决了针对能够实时处理生成的海量流数据的平台和架构的一种迫切需求。了解该产品的设计目标,它适用于哪些时机,其工作原理,以及它如何为 InfoSphere BigInsights 提供补充来执行高度复杂的分析。来自多个来源的信息正在以难以置信的速度增长。互联网用户数量在 2015...2016-10-13 14:14:04 · 346 阅读 · 0 评论 -
6个用于大数据分析处理的最好工具
在大数据和大数据分析,他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息,如杂志,报纸,文章。大数据产生...2016-10-14 14:03:07 · 260 阅读 · 0 评论 -
IBM 全新大数据分析平台,助力数据云化
IT架构实现云化已经是企业IT战略的大势所趋。无论是采用私有云技术还是公有云技术,都要求软件具备云环境的适应能力。作为企业最重要的数据资产,依赖于底层的数据管理软件进行有效的管理。为实现从海量数据中得到实用的知识和信息,如何高效组织数据的存储和查找的技术一直在演进。从早期的层次型数据库到关系型数据库,从SQL数据库到NoSQL数据库再到处理非结构化数据的Hadoop、图数据库等平台,一直在发展...2016-10-17 11:16:45 · 226 阅读 · 0 评论 -
医疗大数据解决方案
医疗大数据生命周期在阿斯克医疗大数据方法论中,把医疗数据的生命周期分成下图的四个象限:第一象限:数据采集 在数据采集阶段,医院通常会使用关系型数据库(例如Oracle,DB2,MySQL……),其核心诉求是要保障数据的完整性和一致性,确保数据不会因为软硬件故障而遭到损失。此外,随着互联网流量的引入,数据的联机处理量级和效率也成为一个重要的考量。一些医院为提升联机事务的处理效率,引入分...2016-10-18 14:36:35 · 935 阅读 · 0 评论 -
全球最值得关注的100家人工智能公司(中国27家)
在过去两年多时间里,机器之心采访、记录和报道了全球人工智能领域无数优秀的人工智能技术、公司和产品。但随着行业的发展,我们也逐渐意识到,越来越多概念化与噱头性的产品和团队已经开始让正处于变革拐点的行业变得浮躁和难以判断。关于人工智能行业,到底哪些才是最值得我们关注的公司,而哪些公司又将主导人工智能的未来?We believe AI should be an extension of indiv...2016-10-19 11:30:43 · 213 阅读 · 0 评论 -
一张图,带你读懂 IBM 云上真实洞察数据那些事
在传统的交易数据库系统中,伴随着客户的交易行为发生,在业务系统中产生了相应的交易数据,并保存在关系型数据库系统,从而形成了业务的交易记录,各类业务应用系统都是围绕着关系型数据库打交道。当今,大家都已看到的现实状况是:随着越来越多面向移动(mobile-oriented)的应用被大量企业/机构所使用,很多交易数据以 JSON 文档形式产生,并保存在 NoSQL 数据库系统中。很多企...2016-10-20 13:43:03 · 175 阅读 · 0 评论 -
流式大数据实时处理—技术、平台及应用
编者注:陈纯,计算机应用专家,浙江大学计算机科学与技术学院教授,中国工程院院士。是国家教委“跨世纪优秀人才培养计划”首批入选专家,第三届中国青年科技奖获得者。目前是国家列车智能化工程技术研究中心主任,国务院学位委员会学科评议组成员。陈纯教授长期从事计算机应用领域的前沿研究工作,在著名国际学术期刊和会议发表论文160多篇,曾获国家技术发明奖二等奖1项,国家科技进步奖二等奖2项,国家科技进步三等奖1...2016-10-24 13:26:29 · 759 阅读 · 0 评论 -
Hadoop和大数据:60款顶级开源工具
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工...2016-11-07 10:10:08 · 180 阅读 · 0 评论 -
惊艳全球数据行业的16个数据可视化例子
数据是非常强大的。当然,如果你能真正理解它想告诉你的内容,那它的强大之处就更能体现出来了。 通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事。必须用一个合乎逻辑的、易于理解的方式来呈现数据。谈谈数据可视化人类的大脑对视觉信息的处理优于对文本的处理——因此使用图表、图形和设计元素,数据可视化可以帮你更容易的解释趋势和统计数据。但是,并非所有的数据可视化是平等的...2016-09-28 11:19:21 · 6484 阅读 · 1 评论 -
10款超好用的工具助力大数据与分析技术
考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。下面我们将整理出一份包含十款工具的清单,从而有效压缩选择范畴。数据已经成为现代化企业中最为重要的宝贵资源。一切决策、策略或者方法都需要依托于对数据的分析方可实现。随着“大数据分析”逐步替代其上代版本,即“商务智能”...2016-09-27 11:55:50 · 163 阅读 · 0 评论 -
大数据时代:九个大数据应用领域
随着大数据应用越来越广泛,应用的行业也越来越低,每天都可以看到大数据的一些新奇的应用,从而帮助人们从中获取到真正有用的价值。很多组织或者个人都会受到大数据分析影响,但是大数据是如何帮助人们挖掘出有价值的信息呢?下面就让我们一起来看看九个价值非常高的大数据的应用,这些都是大数据在分析应用上的关键领域:1、大数据正在改善我们的生活大数据不单单只是应用于企业和政府,同样也适用我们生活当...2016-08-19 10:53:31 · 199 阅读 · 0 评论 -
大数据时代:十大最热门的大数据技术
随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。预测分析:预测分析是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。可为预测、优化、预报和模拟等许多其他用途而部署。随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优...2016-08-22 14:20:50 · 118 阅读 · 0 评论 -
互联网人必读 | 大数据思维的十大核心原理
大数据思维是客观存在,大数据思维是新的思维观。用大数据思维方式思考问题,解决问题是当下企业潮流。大数据思维开启了一次重大的时代转型。 大数据思维原理是什么?笔者概括为10项原理。一、数据核心原理从“流程”核心转变为“数据”核心大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需...2016-08-24 14:05:56 · 207 阅读 · 0 评论 -
将现有的SQL工作负载迁移至hadoop竟然如此简单!
想迁移现有的数据仓库到Hadoop平台?想在Hadoop上重用其他RDMBS的SQL技能?有何方案能帮助您解决这类问题,答案是IBM Big SQL。Big SQL是IBM的SQL on Hadoop解决方案,它充分利用了IBM在RDBMS领域数十年的经验,是业界最成熟、最完善,性能最好的SQL引擎。除此之外,Big SQL还具有其他产品无法比拟的的SQL兼容性。正是这种兼容性,Big SQ...2016-08-25 10:18:35 · 116 阅读 · 0 评论 -
健康管理、运动以及认知技术的结合
每日健身、跑步、快走,然后在微信打卡已经是很多人的习惯。除了关心自己今天的排名外,能否运动的更健康?是否可以更方便和更多的运动专家或健身营养专家互动或接受其指导?出差到了陌生的环境,是否方便得到合适的运动路线?体验当地运动达人的经典线路?亦或与全球运动达人一起竞赛,挑战一个人生目标?作为已经拥有5千万用户的应用Runkeeper在往这个方向努力。我们以前也介绍过其早期的功能《一位盲人运动员跑...2016-08-29 10:30:43 · 138 阅读 · 0 评论 -
大数据时代:看大数据如何帮助你预测消费者的购买意图
如今,大多数营销人员都说,他们的挑战不是缺少数据,而是数据太多,无法有效地加以利用或者辨别哪些是真正重要的数据。营销人员非常希望知道消费者何时想要购物。要是能准确地知道每位消费者在任何指定时间处于购买历程的哪个阶段,那就更好了。那么,大数据真的能帮助你预测消费者的购买意图吗?是的,它能。但如果你不知道哪些数据最为重要,以及如何利用数据改善业务,试图弄清楚如何利用数据预测购买意图,从...2016-09-02 10:36:14 · 589 阅读 · 0 评论 -
干货分享:CDC实时数据复制,大神教你调性能
数据实时复制任务的成与败,取决于多方面的因素,例如:被复制数据本身情况,源系统和目标系统的自身运行状况,网络通讯方面,系统架构设计和实施人员专业技术水平等等。面对复杂而艰巨的任务,IBM 公司专业化实施团队积累了丰富的经验,以下是我们这次分享的 IBM InfoSphere CDC性能调优的重点内容。1. 明白数据复制的需求和使用场景改善并提升数据复制作业性能是双向互动的操作,以满足业务...2016-09-05 11:05:12 · 642 阅读 · 0 评论 -
速度收藏 | 100+篇大数据、数据分析、数据挖掘电子书免费下载!
全部都是电子书,根据书名点击进去即可进入下载页面,不用谢我,请叫我“雷锋”SQL电子书SQL必知必会 R语言电子书《R语言实战》《R语言与统计建模》《统计学与R读书笔记》《R实践运用》《R导论》中文版《R语言与统计分析》《R语言经典入门》《R语言 ggplot2:数据分析与图形艺术》《Learning R》复杂数据统计方法_基于R的应用》《R语言编程艺术》《时间序列分析及应用...2016-09-07 10:20:38 · 489 阅读 · 0 评论 -
Hadoop 信息集成平台,让大数据分析更简单!
就本身而言,Hadoop 不是很有用的东西,原因是它需要编写大量复杂和定制的程序代码,难以治理,也没有数据质量概念和数据治理可谈了。企业用户都忙于去研究如何解决使用 Hadoop 所碰到的问题,主要是涉及到项目实施时间、成本和风险等,而 Hadoop 自身的客户化编程就增加了项目实施时间、成本和风险。大数据项目实施仅靠 Hadoop 是不会成功的,除非你能有效地做好大数据集成这部分的工作,所...2016-09-08 10:49:22 · 179 阅读 · 0 评论 -
收藏 | 全球大数据7大阵营,你都知道吗?
近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目前全球关于大数据行业所涉猎的范围作了一个分类,称其为7大阵营,以下是7大阵营的企业LOGO图。近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目前全...2016-09-13 09:55:04 · 181 阅读 · 0 评论 -
助力大数据集成,且看DataStage新玩法
一、大数据已成为企业信息供应链中的重要一环我们对大数据的认知在前几年还仅仅停留在概念和理论中,但转眼间,你会发现身边的大数据项目如雨后春笋般拔地而起,大数据俨然成为当今热得不能再热的话题和焦点。因为Hadoop及其相关开源技术的横空出世和迅猛发展,越来越多的企业发现那些尘封已久的历史数据或每天正在以指数级产生的交易数据、日志数据和客户行为数据其实蕴藏着巨大的价值,犹如一座座尚未开发的金矿...2016-09-22 10:42:34 · 287 阅读 · 0 评论 -
数据驱动业务——梦想成真,只差一步
长久以来,作为在信息管理领域服务多年的IBM人,就一直有个梦想:当业务人员需要分析公司的经营状况时,当市场部需要在特定时间做精准营销时,当老总紧急临时需要某条业务线的汇总数据时,我们可以有个系统马上及时、准确提供数据,漂亮美观地满足各种需求,实现数据驱动业务的目标!我们长久向往超市的模式:需要买东西的顾客轻松自在地在宽敞、整洁的货架上自由选择,当选择结束后,自行去收银台结账付款,需求满足、货品组...2016-09-26 11:16:11 · 129 阅读 · 0 评论 -
干货 | 人工智能体系大纲图谱(初、中、高级篇)
可以用来开发机器学习主要有三门语言:Python Java C++,其中Python是主流。下面是Python具体的学习大纲,所以大家也可以参考来学习一下。 可以用来开发机器学习主要有三门语言:Python/Java/C++,其中Python是主流。 下面是Python具体的学习大纲,所以大家也可以参考来学习一下。 一 、人工智能基础语法篇点击图片查看高清大图...2016-11-08 10:08:09 · 196 阅读 · 0 评论