数据库
文章平均质量分 79
清图
微信:qinghuashuyou微博:清华大学出版社第五事业部
展开
-
【数据科学的实践指南】---《R数据科学实战(第2版)》是如何实现的?
《R数据科学实战》(第2版)是一本针对数据科学的实践指南,重点介绍了使用R语言和统计程序包处理结构化或表格数据的相关技术,也着重介绍了机器学习的技术。但它的独特之处在于专门讨论了数据科学家在项目中的角色、所管理的交付结果,甚至设计演示文稿等主题。本书不仅研究了如何编写模型,还讨论了如何与不同的团队协作,如何将业务目标转化为度量值,以及如何组织工作和编写报告等。如果你想学习如何使用R语言来从事数据科学家的工作,那么建议你阅读本书。 我们认识Nina Zume...原创 2022-03-02 14:58:48 · 1010 阅读 · 0 评论 -
有了TA,不再为商业分析解决方案犯愁
统计学领域已经存在了200 多年。到了20 世纪50 年代,统计学已发展成为一门颇受人们重视的基础学科。它的重要性在20 世纪90 年代随着新型巨量数据源的出现而迅速增加。在21 世纪的前十年,人们的注意力都被吸引到生物应用上,特别是由于人类基因组测序出现的基因数据。但最近十年来,人们发现在商业领域中可用的数据急剧增加,因而人们对统计学在商业领域中应用的兴趣也急剧提升。 十年前,当我的统计学选修课吸引攻读MBA 的全部同学时,我的同事感到十分震惊,因为那时我们学院正在为选修课...原创 2021-11-17 17:27:04 · 698 阅读 · 0 评论 -
Spring Batch权威指南 之“批处理和 Spring”
提到数据处理,很多人可能会想到大数据平台上的批处理和流式处理。为了使用 Hadoop生态, 应用开发者可能会在层出不穷的“大数据概念”中举步不前,在眼花缭乱的组件面前望而却步。假如 要处理的数据集不是那么“大”,处理也不是很复杂,那么对于 Java开发者而言,有没有简单易用的 框架和工具呢?Spring Batch就是可能的答案。对于数据工程师而言,Spring Batch未免有些鸡肋;但是 对于 Java应用开发者,尤其是有一定经验的 Java 应用开发者而言,Spring Batch未尝不...原创 2021-02-08 15:17:55 · 1684 阅读 · 6 评论 -
基于Spark 和Scala 的最先进数据分析技术有哪些?
“我之所以要翻译这本书,也是源于我对大数据生态圈的理解和判断。与传统的MR 计算框架相比,Spark 有着足够的性能和易编程方面的优势,并且Spark 本身也正在形成自己的生态体系。而Spark 的原生语言Scala 将面向对象和函数式编程语言的优势融为一体,因此有着足够的理由让我看好。数据分析和机器学习,就更不必多言了。这都是当前IT 领域最热门的技术方向。” ——《Scala和Spark大数据分析 函数式编程、...原创 2020-07-26 12:24:03 · 3483 阅读 · 0 评论 -
大数据理论技术在行业中有哪些应用?
进入21世纪以来,信息技术的发展突飞猛进,人类从信息时代步入数字时代,又马不停蹄地进入了数据时代。自2008年大数据被业界正式提出后,围绕大数据的科学研究和产业应用如火如荼,快速实现了从名词炒作到应用落地,数据采集、数据处理、数据建模、数据分析和数据可视化等大数据相关技术在越来越多的行业中得到了广泛研究和普遍应用。与此同时,我国政府高度重视大数据的理论研究和产业应用,并大力支持高校开设大数据科学与技术相关学科专业,以应对持续井喷的大数据人才需求。译者作为这一伟大时代的普通见证者和实践者,深深感到大数据技..原创 2020-07-24 15:56:17 · 3875 阅读 · 0 评论 -
大数据MBA 通过大数据实现与分析驱动企业决策与转型
商业利益相关者放弃对信息技术数据和分析方法控制的日子已经结束了。商业利益相关者在对机构进行数据收集和分析工作提供支持和货币化方面必须处于前沿及核心的位置。商业领导者需要了解在何处以及如何使用大数据,利用客户、产品和运营数据的新来源之间的冲突,再加上数据科学,优化关键业务流程,发现新的货币化机会,创造竞争优势新来源。然而,将商业用户改造成数据科学家是不现实的。最重要的是,我们应当教会商业用户像数据科学家一样思考,这样他们便可以利用信息技术,与数据科学家合作,进行用例识别、需求定义、业务估值以及最终的分析操作。原创 2017-11-08 16:19:05 · 1205 阅读 · 1 评论 -
《MongoDB大数据处理权威指南(第2版)》之MongoDB入门
想象一下这样的世界:数据库使用是如此的简单,以至于你忘记了正在使用它。再想象一下这样的世界:不需要任何复杂配置或设置,数据库仍然能够快速运行,并且具有良好的扩展性。想一下,如何可以只关注gg于手上的任务,完成它,并可以按时下班。这听起来有点神奇,但是MongoDB承诺帮助你完成所有这些事情(甚至更多)。 MongoDB(源自单词humongous)是一种相对较新的数据库,它没有表、模式、原创 2014-12-03 09:36:24 · 8500 阅读 · 14 评论 -
《专业级Oracle Database 12c安装、配置与维护》之在SQL*Plus中编写PL/SQL
当编写PL/SQL程序时,可以用多种方式来运行。可以直接在SQL*Plus(或某些其他SQL环境,如SQL Developer)中运行,也可以将之存储在数据库中,然后从SQL环境或程序运行。当在数据库中存储程序时,该程序被称为存储程序(stored program)或存储对象(stored object)。这在本章稍后讲解。现在,让我们来讨论如何使用SQL*Plus编写程序。虽然是从SQL*Plu原创 2014-11-24 10:33:54 · 4824 阅读 · 8 评论 -
《Hadoop高级编程》之为Hadoop实现构建企业级安全解决方案
本章内容提要● 理解企业级应用的安全顾虑● 理解Hadoop尚未为企业级应用提供的安全机制● 考察用于构建企业级安全解决方案的方法 第10章讨论了Hadoop安全性以及Hadoop中用于提供安全控制的机制。当构建企业级安全解决方案(它可能会围绕着与Hadoop数据集交互的许多应用程序和企业级服务)时,保证Hadoop自身的安全仅仅是安全解决方案的原创 2014-07-29 10:33:27 · 5594 阅读 · 18 评论 -
11g R1 & R2新特性介绍(针对DBA和开发者)
首先我要说明:本文主要目的是帮助初级和中级水平的Oracle专业人士了解Oracle系统及更好地优化它。后面的章节里也介绍了不少专家主题,但首要的任务却是协助那些被性能问题折磨得很沮丧的专业人士,他们正寻求着改善数据库性能的简单诀窍。本书的目标很单纯:提供一个装满此类诀窍的弹药库,在各种不同的情况下您都可以运用它来使系统快起来。 自本书的9i版始,第1章成了讲述新特性的一章(介绍很多调优原创 2014-02-26 10:35:38 · 9309 阅读 · 9 评论 -
分布式云数据中心的建设与管理--云计算给数据中心带来的变革和好处
维基百科对数据中心的定义为:“数据中心是一整套复杂的设施,它不仅仅包括计算机、系统和其他与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置。” 数据中心是工业化和信息化融合的产物,是政府、各行业的信息化系统核心。传统的数据中心为企业或机构提供IT基础设施与应用服务,办公信息化大大提升了社会的工作效率。由于其IT资源的烟囱式设计、僵化的IT架构原创 2013-08-26 09:16:10 · 2674 阅读 · 0 评论 -
Oracle数据库资源管理
一般来说,Oracle数据库都属于中大型的系统,这类系统的用户会话(Session),小则一两百,多则上千,这些用户会话要求Oracle数据库执行的任何指令都需要耗费系统资源,而系统资源毕竟是宝贵且有限的,一旦突然涌进大量的用户会话,对于有限的资源可能会略显不足。但这些会话必定有轻重缓急之分,对于重要且紧急的用户会话需求理当获得多一点的系统资源,对于一些不重要或不紧急的用户会话,则可以使用较少的系原创 2012-06-06 08:52:01 · 2345 阅读 · 1 评论 -
Oracle Database 11g RAC手册(第2版)(oracle产品管理总监 BobThome作序推荐)
基本信息原书名:Oracle Database 11g Real Application Clusters Handbook,Second Edition原出版社: McGraw-Hill作者: (美)K Gopalakrishnan [作译者介绍] 译者: 贾洪峰 梁涛 郭绍明 出版社:清华大学出版社 ISBN:9787302288091上架时间:2原创 2012-06-25 11:25:51 · 3426 阅读 · 0 评论 -
可取性、适用性、可行性:内存计算技术的影响
摘要:对于支持人机互动的应用程序来说,亚秒级的响应时间和实时分析是关键指标。我们预计,企业级应用的用户将像如今所有互联网用户与Web搜索引擎互动一样,很自然地与软件工具互动,可以在初始结果无法满足搜索需求时,实时完善搜索结果。本书的第一章将阐述这一实时提供业务数据的愿景,并介绍它的可取性、适用性和可行性。首先,我们将介绍对实时提供信息的渴求,并阐述企业级应用环境中的亚秒级响应时间。其次,我们将以充原创 2012-08-22 10:53:34 · 5397 阅读 · 2 评论 -
用集群实现网格计算
集群是Oracle网格计算方法的组成部分,利用这一技术,几个低成本商品硬件组件通过联网结合在一起,获得更大的计算容量。按需提供的可伸缩性是通过添加补充节点并将工作量分发到可用计算机上实现的。可伸缩性和应用程序性能的改进可以通过3种方法完成。● 更努力地工作。● 更聪明地工作。● 获取帮助。 “更努力地工作”意味着添加更多原创 2012-06-12 10:12:19 · 1941 阅读 · 0 评论 -
Oracle管理之道(拥有OCP认证资格、DBA职业人现任华硕公司DBA张天慧力作)
编辑推荐:最完整、最真实、最灵活的oracle数据库指南深受巨型数据库之苦的DBA提供最佳的经验指导拥有OCP认证资格、DBA职业人现任华硕公司DBA张天慧力作 样章试读:http://product.china-pub.com/199779 基本信息作者:张天慧著ISBN:978-7-302-28540-原创 2012-05-10 06:07:03 · 7800 阅读 · 0 评论 -
Effective MySQL之MySQL EXPLAIN命令详解
作为一名日常DBA,最常重复的任务就是在生产环境中检查和优化运行的SQL语句。在MySQL软件安装、配置以及正常运行之后,监控数据库的性能问题就成为一项经常重复的工作。了解如何正确地截取有问题的SQL语句以及检查并做适当的调整,这已经成为一个专业DBA的必备技能。尽管MySQL是一个关系型数据库管理系统(RDBMS),有Oracle或者SQL Server背景的有经验的数据库管理员还是需要学习原创 2012-12-20 09:34:53 · 5319 阅读 · 0 评论 -
数据挖掘过程:从目标到任务再到技术
数据挖掘过程制定数据挖掘问题:从目标到任务再到技术一般数据挖掘的良性循环描述为一个业务流程,其中把数据挖掘划分为4个阶段:(1) 识别问题(2) 将数据转换为信息(3) 采取行动(4) 度量结果 本文的重点转向把数据挖掘作为技术过程,把识别业务问题转变为将业务问题转化为数据挖掘问题。同时,第二个阶段——把数据转换为信息,将扩展到几个主题,包括假设检验(h原创 2013-04-27 13:34:14 · 8436 阅读 · 19 评论 -
SAP内存计算--HANA 走近SAP HANA
第一章 走近SAP HANA摘要:拿到这本书的读者,相信您对SAP HANA已经有所耳闻。对于这样一个基于内存计算创新型的高性能数据处理平台,我们应该如何去理解和应用?如何将它融入到我们现有的企业信息化架构中去?在回答这些问题之前,我们首先需要理解SAP HANA到底是什么,它所倡导的内存计算是如何给企业带来价值,SAPHANA对于企业和SAP公司自身来说的技术路线图,以及SA原创 2013-06-06 10:54:15 · 4199 阅读 · 5 评论 -
循序渐进DB2 (第2版)——DBA系统管理、运维与应用案例
本书全面揭示了性能相关的主题,并从基本原理入手,解释造成性能问题的根本原因,并提供最好的解决方法,从而实现DB2数据库的调优原创 2013-07-15 17:08:04 · 3241 阅读 · 0 评论 -
Oracle安全实战——开发完全的数据库与中间件环境
基本信息原书名: Applied Oracle Security: Developing Secure Database and Middleware Environments原出版社: McGraw-Hill Osborne Media 作者: (美)David C. Knox Scott G. Gaetjen 译者: 孟祥旭 唐扬斌 出版社:清华大学出版社原创 2012-05-13 20:13:53 · 5520 阅读 · 0 评论