自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

干货 | 人工智能体系大纲图谱(初、中、高级篇)

可以用来开发机器学习主要有三门语言:Python Java C++,其中Python是主流。下面是Python具体的学习大纲,所以大家也可以参考来学习一下。 可以用来开发机器学习主要有三门语言:Python/Java/C++,其中Python是主流。 下面是Python具体的学习大纲,所以大家也可以参考来学习一下。 一 、人工智能基础语法篇点击图片查看高清大图...

2016-11-08 10:08:09 198

Hadoop和大数据:60款顶级开源工具

说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工...

2016-11-07 10:10:08 182

2017年十大战略科技发展趋势,你值得关注!

如今技术创新的速度比以往任何时候都快。就在几年前,云技术被认为是最前沿的。现在,不仅互联网企业都在部署云计算,传统企业也纷纷向云计算转型。对于未来科技发展趋势,我们依然充满期待。全球信息技术研究和顾问公司Gartner曾提出十项将在2016年影响多数企业机构战略科技趋势的研究结果。包括:终端网络(Device Mesh)、环境用户体验(Ambient User Experience)、3...

2016-11-04 10:16:34 174

流式大数据实时处理—技术、平台及应用

编者注:陈纯,计算机应用专家,浙江大学计算机科学与技术学院教授,中国工程院院士。是国家教委“跨世纪优秀人才培养计划”首批入选专家,第三届中国青年科技奖获得者。目前是国家列车智能化工程技术研究中心主任,国务院学位委员会学科评议组成员。陈纯教授长期从事计算机应用领域的前沿研究工作,在著名国际学术期刊和会议发表论文160多篇,曾获国家技术发明奖二等奖1项,国家科技进步奖二等奖2项,国家科技进步三等奖1...

2016-10-24 13:26:29 759

一张图,带你读懂 IBM 云上真实洞察数据那些事

在传统的交易数据库系统中,伴随着客户的交易行为发生,在业务系统中产生了相应的交易数据,并保存在关系型数据库系统,从而形成了业务的交易记录,各类业务应用系统都是围绕着关系型数据库打交道。当今,大家都已看到的现实状况是:随着越来越多面向移动(mobile-oriented)的应用被大量企业/机构所使用,很多交易数据以 JSON 文档形式产生,并保存在 NoSQL 数据库系统中。很多企...

2016-10-20 13:43:03 176

全球最值得关注的100家人工智能公司(中国27家)

在过去两年多时间里,机器之心采访、记录和报道了全球人工智能领域无数优秀的人工智能技术、公司和产品。但随着行业的发展,我们也逐渐意识到,越来越多概念化与噱头性的产品和团队已经开始让正处于变革拐点的行业变得浮躁和难以判断。关于人工智能行业,到底哪些才是最值得我们关注的公司,而哪些公司又将主导人工智能的未来?We believe AI should be an extension of indiv...

2016-10-19 11:30:43 214

医疗大数据解决方案

医疗大数据生命周期在阿斯克医疗大数据方法论中,把医疗数据的生命周期分成下图的四个象限:第一象限:数据采集 在数据采集阶段,医院通常会使用关系型数据库(例如Oracle,DB2,MySQL……),其核心诉求是要保障数据的完整性和一致性,确保数据不会因为软硬件故障而遭到损失。此外,随着互联网流量的引入,数据的联机处理量级和效率也成为一个重要的考量。一些医院为提升联机事务的处理效率,引入分...

2016-10-18 14:36:35 936

IBM 全新大数据分析平台,助力数据云化

IT架构实现云化已经是企业IT战略的大势所趋。无论是采用私有云技术还是公有云技术,都要求软件具备云环境的适应能力。作为企业最重要的数据资产,依赖于底层的数据管理软件进行有效的管理。为实现从海量数据中得到实用的知识和信息,如何高效组织数据的存储和查找的技术一直在演进。从早期的层次型数据库到关系型数据库,从SQL数据库到NoSQL数据库再到处理非结构化数据的Hadoop、图数据库等平台,一直在发展...

2016-10-17 11:16:45 226

6个用于大数据分析处理的最好工具

在大数据和大数据分析,他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息,如杂志,报纸,文章。大数据产生...

2016-10-14 14:03:07 260

InfoSphere Streams——实时大数据分析平台

了解 InfoSphere Streams,它是 IBM 大数据平台的一部分。InfoSphere Streams 解决了针对能够实时处理生成的海量流数据的平台和架构的一种迫切需求。了解该产品的设计目标,它适用于哪些时机,其工作原理,以及它如何为 InfoSphere BigInsights 提供补充来执行高度复杂的分析。来自多个来源的信息正在以难以置信的速度增长。互联网用户数量在 2015...

2016-10-13 14:14:04 350

干货 | 数据挖掘入门必看10个问题

NO.1 Data Mining 和统计分析有什么不同? 硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出...

2016-10-12 10:40:01 128

Apache Hadoop 3.0新版本介绍及未来发展方向(内附PDF)

本文PPT来自 Hadoop研发工程师张喆、陈霄讲《Apache Hadoop 十周岁展望前方》在Strata + Hadoop World2016会议上的分享。过去十年,Apache Hadoop从无到有,从理论概念演变到如今支撑起若干全球最大的生产集群。接下来的十年,Hadoop将继续壮大,并发展支撑新一轮的更大规模、高效和稳定的集群。 我们此次将向大家全面介绍即将到来的Apache H...

2016-10-11 11:04:32 228

10大天然大数据公司,看他们如何挖掘数据价值

1、亚马逊的“信息公司”   亚马逊要处理海量数据,交易数据的直接价值很大。作为一家“信息公司”,亚马逊从每个用户的购买行为中获取信息,将用户在网站上的行为记录下来,页面停留时间、用户查看评论、搜索关键词、浏览商品等。亚马逊对数据价值的敏感和重视及挖掘能力,使它远超传统运营方式。2、谷歌“意图”   准确定义“大数据”概念的科技公司非谷歌莫属。根据搜索研究机构的数据,仅1个月...

2016-10-10 14:03:50 162

SPSS干货分享:区分T检验与F检验

1. T 检验和 F 检验的由来一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布 (probability distribution) 进行比较,我们可以知道在多少 % 的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦...

2016-10-09 11:24:08 612

拥抱开源 - 云上元数据管理

上期我们讲述的是实现数据工程师梦想的一个小目标《梦想成真,只差一步》,里面提到了要实现数据超市的管理,数据工程师需要使用合适的工具将数据进行整理、组合、分类后上架,然后业务分析师和数据科学家就可以使用了。在整个数据工程师的工作流程中,需要自始至终的进行数据治理:我们需要将每种类型的数据进行清晰的标识以及分类,以利于其它角色的用户进行查找以及使用;我们需要将每种数据的使用范围进行管理以及监...

2016-09-30 10:50:47 375

IBM SPSS Modeler数据库内建模

IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数...

2016-09-29 11:08:35 258

惊艳全球数据行业的16个数据可视化例子

数据是非常强大的。当然,如果你能真正理解它想告诉你的内容,那它的强大之处就更能体现出来了。   通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事。必须用一个合乎逻辑的、易于理解的方式来呈现数据。谈谈数据可视化人类的大脑对视觉信息的处理优于对文本的处理——因此使用图表、图形和设计元素,数据可视化可以帮你更容易的解释趋势和统计数据。但是,并非所有的数据可视化是平等的...

2016-09-28 11:19:21 6494 1

10款超好用的工具助力大数据与分析技术

考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。下面我们将整理出一份包含十款工具的清单,从而有效压缩选择范畴。数据已经成为现代化企业中最为重要的宝贵资源。一切决策、策略或者方法都需要依托于对数据的分析方可实现。随着“大数据分析”逐步替代其上代版本,即“商务智能”...

2016-09-27 11:55:50 163

数据驱动业务——梦想成真,只差一步

长久以来,作为在信息管理领域服务多年的IBM人,就一直有个梦想:当业务人员需要分析公司的经营状况时,当市场部需要在特定时间做精准营销时,当老总紧急临时需要某条业务线的汇总数据时,我们可以有个系统马上及时、准确提供数据,漂亮美观地满足各种需求,实现数据驱动业务的目标!我们长久向往超市的模式:需要买东西的顾客轻松自在地在宽敞、整洁的货架上自由选择,当选择结束后,自行去收银台结账付款,需求满足、货品组...

2016-09-26 11:16:11 129

数据可视化神器——Cognos Analytics V11 R4 发布!

Cognos Analytics V11的第4个小版本已经发布了。新版本更加美貌易用。IBM改进了仪表板、报表、Javascript的支持、建模、客户化并增加了Storytelling和生命周期管理。本期文章重点为大家介绍仪表板的新功能。仪表板的颜值和适用性在这个版本中有了进步。增加了一些很有用的数据探索特性如条件格式、交叉表和顶部/底部计数;当数据变化频繁时,刷新定时器可以自动的刷新仪表板...

2016-09-23 16:30:06 338

助力大数据集成,且看DataStage新玩法

一、大数据已成为企业信息供应链中的重要一环我们对大数据的认知在前几年还仅仅停留在概念和理论中,但转眼间,你会发现身边的大数据项目如雨后春笋般拔地而起,大数据俨然成为当今热得不能再热的话题和焦点。因为Hadoop及其相关开源技术的横空出世和迅猛发展,越来越多的企业发现那些尘封已久的历史数据或每天正在以指数级产生的交易数据、日志数据和客户行为数据其实蕴藏着巨大的价值,犹如一座座尚未开发的金矿...

2016-09-22 10:42:34 290

主数据管理解决方案,IBM 仍是业界领军人

主数据管理(Master Data Management,简称 MDM)帮助企业/机构通过其最重要的信息来产生业务上的商业价值。通过对企业的客户、产品、帐户等关键业务信息进行管理,不仅能够提高收入,还有助于降低成本、提高业务灵活性和降低风险。 IBM InfoSphere MDM 可帮助企业集中在多个重要的业务主题数据领域,提供功能强大的 SOA 服务,以多种灵活而适用的主数据实施和部署方式,去...

2016-09-21 10:21:42 370

大数据可视化的最新动态

引言数据可视化是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息。基于可视化发现数据的方法允许用户使用不同的数据源,来创建自定义分析。先进的分析集成了许多方法,为了支持交互式动画在台式电脑、笔记本电脑或平板电脑、智能手机等移动设备上创建图形桌面。根据调查,表1显示了数据可视化的好处。 对于可视化有以下几点建议 大数据是大容量、高速度并且数据之间差异很大的数据集...

2016-09-20 10:52:30 228

非常实用的10款网站数据实时分析工具

网络分析工具可以帮助你收集、预估和分析网站的访问记录,对于网站优化、市场研究来说,是个非常实用的工具。每一个网站开发者和所有者,想知道他的网站的完整的状态和访问信息,目前互联网中有很多分析工具。1. Google Analytics 这是一个使用最广泛的访问统计分析工具,几周前,Google Analytics推出了一项新功能,可以提供实时报告。你可以看到你的网站中目前在线的访客数量,了解...

2016-09-19 11:17:00 181

IBM 信息集成解决方案,让大数据处理更简单!

经过一年多来,我们每逢周三发布有关 IBM 信息集成(Information Integration & Governance 简称 IIG)的文章素材,相信大家对 IBM 公司在该领域为用户所提供的解决方案,以及为业界已所做出的贡献,都有目共睹了。然而,这年头 IT 技术和信息科学变得太快了,所以,很有必要带领大家去逛逛 IBM IIG 这片大森林,以更全面地认识和理解 IBM IIG...

2016-09-14 11:19:22 286

收藏 | 全球大数据7大阵营,你都知道吗?

近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目前全球关于大数据行业所涉猎的范围作了一个分类,称其为7大阵营,以下是7大阵营的企业LOGO图。近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目前全...

2016-09-13 09:55:04 182

大数据时代:传统BI还能走多远?

从事BI多年,经历了经营分析系统的大建设,大发展时期,也有幸处在大数据与传统BI系统的交替之际,因此特别来谈谈,传统BI还能走多远?技术为业务服务,因此这里不谈技术,更多从使用者的角度去阐述原因,理了八个方面,每个方面都是笔者亲历,当然任何穷举法都无法证明绝对正确,但希望能引起思考。[b]1、资源申请-从月到日,不可同日耳语[/b]自从企业有了[url=http://b...

2016-09-12 11:49:43 114

Hadoop 信息集成平台,让大数据分析更简单!

就本身而言,Hadoop 不是很有用的东西,原因是它需要编写大量复杂和定制的程序代码,难以治理,也没有数据质量概念和数据治理可谈了。企业用户都忙于去研究如何解决使用 Hadoop 所碰到的问题,主要是涉及到项目实施时间、成本和风险等,而 Hadoop 自身的客户化编程就增加了项目实施时间、成本和风险。大数据项目实施仅靠 Hadoop 是不会成功的,除非你能有效地做好大数据集成这部分的工作,所...

2016-09-08 10:49:22 182

速度收藏 | 100+篇大数据、数据分析、数据挖掘电子书免费下载!

全部都是电子书,根据书名点击进去即可进入下载页面,不用谢我,请叫我“雷锋”SQL电子书SQL必知必会 R语言电子书《R语言实战》《R语言与统计建模》《统计学与R读书笔记》《R实践运用》《R导论》中文版《R语言与统计分析》《R语言经典入门》《R语言 ggplot2:数据分析与图形艺术》《Learning R》复杂数据统计方法_基于R的应用》《R语言编程艺术》《时间序列分析及应用...

2016-09-07 10:20:38 490

在Jupyter Notebooks里进行大数据分析,So easy!

想体验数据分析却没有环境怎么办?数据科学家集成工作台(Data Scientist Workbench)无疑是您最便利的,而且是免费的平台。数据科学家集成工作台是一个基于开源的云端“一站式”数据科学分析工作平台,囊括了所有主要的开源工具,例如iPython/Jupyter、RStudio、Apache Zeppelin、OpenRefine等。它提供非常友好的即时交互式学习体验,无需任何本地...

2016-09-06 10:28:59 482

干货分享:CDC实时数据复制,大神教你调性能

数据实时复制任务的成与败,取决于多方面的因素,例如:被复制数据本身情况,源系统和目标系统的自身运行状况,网络通讯方面,系统架构设计和实施人员专业技术水平等等。面对复杂而艰巨的任务,IBM 公司专业化实施团队积累了丰富的经验,以下是我们这次分享的 IBM InfoSphere CDC性能调优的重点内容。1. 明白数据复制的需求和使用场景改善并提升数据复制作业性能是双向互动的操作,以满足业务...

2016-09-05 11:05:12 643

大数据时代:看大数据如何帮助你预测消费者的购买意图

如今,大多数营销人员都说,他们的挑战不是缺少数据,而是数据太多,无法有效地加以利用或者辨别哪些是真正重要的数据。营销人员非常希望知道消费者何时想要购物。要是能准确地知道每位消费者在任何指定时间处于购买历程的哪个阶段,那就更好了。那么,大数据真的能帮助你预测消费者的购买意图吗?是的,它能。但如果你不知道哪些数据最为重要,以及如何利用数据改善业务,试图弄清楚如何利用数据预测购买意图,从...

2016-09-02 10:36:14 590

IBM SPSS Modeler算法系列------C&R Tree算法介绍

C&R Tree全称是Classification and Regression Tree,即分类及回归树,它是由美国斯坦福大学和加州大学伯克利分校的Breiman等人于1984年提出的,从名称中不难理解,它包含了分类树和回归树,分类树用于目标变量是分类型的,回归树用于目标变量是连续型的。该算法分割的核心技术取决于目标变量的类型,如果是分类变量,可以选择使用Gini或者是Twoing...

2016-09-01 10:23:26 991

大数据时代,IBM 带你玩转大数据处理

IBM Big Replication V2.0 在今年中刚发布,是面向 Hadoop 和 Cloud 的大数据复制以及灾难备份解决方案。该产品前身是 WANdisco 公司拳头产品,WANdisco Fusion 是该公司在全球唯一能在广域网上进行实时交易数据复制的技术,适用于所有行业。经过商业收购重组,目前,IBM 正在全球大力地推广和销售 IBM Big Replication 解决方案。...

2016-08-31 11:00:40 167

文本数据分析神器—— IBM BigInsights Text Analytics

文本数据分析的价值文本数据在我们的生活中无处不在:在微信朋友圈、微博中发表的感想;在论坛上发表的评价商品的帖子;由应用后台自动生成的机器日志等。这类数据本身包含了大量有用的信息,但由于文本表达方式可以很灵活,在不需要严格遵循语法的情况下也能准确表达信息。比如下图中表达人物年龄就有三种不同的说法。例子中,关于年龄最重要的信息是姓名和岁数,图中右侧的的结构化数据才是表达这些核心信息、应用可以...

2016-08-30 10:49:19 573 1

健康管理、运动以及认知技术的结合

每日健身、跑步、快走,然后在微信打卡已经是很多人的习惯。除了关心自己今天的排名外,能否运动的更健康?是否可以更方便和更多的运动专家或健身营养专家互动或接受其指导?出差到了陌生的环境,是否方便得到合适的运动路线?体验当地运动达人的经典线路?亦或与全球运动达人一起竞赛,挑战一个人生目标?作为已经拥有5千万用户的应用Runkeeper在往这个方向努力。我们以前也介绍过其早期的功能《一位盲人运动员跑...

2016-08-29 10:30:43 139

报表中的多维数据分析,并没有你想象的那么难!

Cognos Analysis Studio是Cognos用于数据多维分析和探查的基于Web的工具。我们可以在交互式的环境中通过拖放的方式浏览、分析以及比较维度数据,以查找业务问题的答案。例如,可以从产品属性和销售属性对销售情况进行分析,通过对一定时段的销售情况进行分析,可以了解到影响销售的因素,从而做出有针对性的销售策略、政策和资源的调整。本文介绍怎样使用Analysis Studio进行数据...

2016-08-26 10:26:32 607

将现有的SQL工作负载迁移至hadoop竟然如此简单!

想迁移现有的数据仓库到Hadoop平台?想在Hadoop上重用其他RDMBS的SQL技能?有何方案能帮助您解决这类问题,答案是IBM Big SQL。Big SQL是IBM的SQL on Hadoop解决方案,它充分利用了IBM在RDBMS领域数十年的经验,是业界最成熟、最完善,性能最好的SQL引擎。除此之外,Big SQL还具有其他产品无法比拟的的SQL兼容性。正是这种兼容性,Big SQ...

2016-08-25 10:18:35 118

互联网人必读 | 大数据思维的十大核心原理

大数据思维是客观存在,大数据思维是新的思维观。用大数据思维方式思考问题,解决问题是当下企业潮流。大数据思维开启了一次重大的时代转型。 大数据思维原理是什么?笔者概括为10项原理。一、数据核心原理从“流程”核心转变为“数据”核心大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需...

2016-08-24 14:05:56 212

大数据时代:十大最热门的大数据技术

随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。预测分析:预测分析是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。可为预测、优化、预报和模拟等许多其他用途而部署。随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优...

2016-08-22 14:20:50 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除