排序:
默认
按更新时间
按访问量

《数据科学概论》教材介绍

教材     覃雄派,陈跃国,杜小勇. 《数据科学概论》.中国人民大学出版社.ISBN: 9787300252926.     官方主页:[点击链接]     CSDN博客[点击链接]     SINA博客[点击链接]     京东:[点击链接]     亚马逊:[点击链接]    ...

2018-03-29 17:23:25

阅读数:1738

评论数:0

数据科学时代的计算机(学院/学派)与统计学(学院/学派)

数据科学离不开计算机(包括数据库、数据挖掘、机器学习等),数据科学离不开统计学。这几乎已经是大家的共识了。 但是在数据科学的旗帜下,如何摆放计算机、和统计学,如何融合计算机和统计学,却不是那么容易。统计学家,习惯于用模型来套数据,用模型来套世界。比如对于时间序列数据,统计学家推出了AR、MA、A...

2018-11-13 23:30:58

阅读数:0

评论数:0

《数据科学概论》book chapter preview《时间序列分析》《轨迹数据分析》

时序数据和轨迹数据是重要的数据类型,在《数据科学概论》第二版中,作者将把这两章内容纳进来。预览版已经放到《数据科学概论》配套资源网站的“PPT” 一节,读者可以开始下载(非营利用途)。   http://xiongpai.freecluster.eu/download.html  ...

2018-10-10 17:24:46

阅读数:27

评论数:0

SQL快速入门

关系数据库的查询语言SQL,是一门易学易用的语言。用于对数据库进行数据的增加、删除、修改、简单查询和多维度汇总查询。 学习SQL的有效方法是看别人写的实例,熟读唐诗300首,不会作诗也会吟。   网址https://pan.baidu.com/s/1wDYsAuqYCyABhRklHzyo5...

2018-08-30 23:31:49

阅读数:26

评论数:0

免费电子书《Hadoop&Spark原理、运维、与开发》

2018年9月1日,笔者利用假期完成了该书电子版的第一次校稿,可读性、正确性提高一大截,下载网址不变,大家可以登录下述网址下载最新版本。 笔者编写了一本书《Hadoop&Spark原理、运维、与开发》,电子版免费贡献出来,供大家下载。正如书名所示,该书涵盖技术原理、安装配...

2018-08-13 14:41:27

阅读数:52

评论数:0

《数据科学概论》OLAP实验参考

1.前言本文给出了一个简单的数据仓库模型,事实表保存销售记录,维表保存用户、时间、产品、销售人员、商店等信息,这些维表具有维度的层次结构。比如时间维度的年、月、日等。在这个数据仓库上,我们可以运行数据仓库分析查询,获得一些汇总结果,帮助我们对业务有所了解,以便安排后续的商业活动。本实例的目的是让读...

2018-06-26 23:25:16

阅读数:27

评论数:0

《数据科学概论》OLTP实验参考

1.前言本文给出了一个简单的银行核心业务数据库,支持用户对自己的活期存款账户进行操作,包括开户、存款、取款、转账、查询账户余额等。此外,还提供了对账户信息进行汇总统计的一些查询。注意:对于实际的活期存款,还应该有一个计息操作。本实例的目的,是让读者对关系数据库、OLTP、事务处理、SQL语句等,有...

2018-06-26 23:23:47

阅读数:27

评论数:0

反向传播算法详解with very simple example

本文给出了一个非常小的神经网络。在这个网络上,把反向传播算法的核心逻辑给讲清楚(这是相当不得了的,是作者的得意之作)。1,网络结构整个网络结构只有两个神经元,一个是输入层的神经元,也就是输入层只有一个神经元,一个输出层的神经元,也就是输出层只有一个神经元。如图所示。    输入神经元记为i1,输出...

2018-06-26 22:55:12

阅读数:20

评论数:0

Windows 10上mysql绿色版zip包安装教程

1.什么是绿色版 绿色版是一个zip包,解压缩到某个目标目录以后,修改好配置文件,即完成安装。无需运行安装程序。 备注:本文档仅部分验证,如果有错,请通知qxp1990@ruc.edu.cn覃老师。   2.mysql绿色版安装过程 在这里使用的软件包是mysql-5.5.57-winx...

2018-05-26 20:10:26

阅读数:25

评论数:0

《数据科学概论》的知识体系与学习路线图

前言  知识是有架构的,这就是所谓的知识体系。学习是有路线图的(对学生而言),对老师来讲就是教学计划。 《数据科学概论》的知识体系  数据科学概论,由理论部分和应用部分构成。形成两条线索,两个T型,如图所示。  理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。  应用...

2018-05-06 15:52:40

阅读数:572

评论数:1

使用prometheus监控centos7主机

     如何对服务器硬件和软件进行监控,一款优秀的监控软件是必需的,prometheus就是这样的一款监控软件。    它支持大量的数据库、应用服务器的监控(通过...exporter,本质上是一个agent),当然prometheus也支持节点的监控,包括cpu/mem/disk/networ...

2018-05-02 20:22:48

阅读数:254

评论数:0

windows 10的python 2.7下建立python3.5环境env

// --------------------------------------------------------------------------------(1)好多软件包,目前仅仅支持python 2.7。所以,我们安装python 2.7,以便进行数据科学实验。(2)有少量的软件包,...

2018-04-30 21:39:55

阅读数:67

评论数:0

windows 10上安装配置python 2.7, keras, theano, opencv

// --------------------------------------------------------------------------------------- (1)好多软件包,目前仅仅支持python 2.7。 所以,我们安装python 2.7,以便进行数据科学实验。 (...

2018-04-30 21:24:43

阅读数:74

评论数:0

《数据科学概论》实验参考已经陆续上线

    截至2018年4月份,“《数据科学概论》”教材(覃雄派、陈跃国、杜小勇编著)已经有9个实验参考上线,涉及分类、聚类、回归、关联规则、协同过滤、文本分析、社交网络等专题,新的实验参考也将于近期陆续上线。     感兴趣的老师和同学,可以到以下网址下载。     [下载网址]http://...

2018-04-19 23:13:23

阅读数:54

评论数:0

《数据科学概论》PPT已经陆续上线

   截至2018年4月份,“《数据科学概论》”教材(覃雄派、陈跃国、杜小勇编著)已经有8章PPT上线,其它章节的PPT也将于近期陆续上线。 感兴趣的老师和同学,可以到以下网址下载。     [下载网址]  ...

2018-04-19 23:12:07

阅读数:279

评论数:2

新闻——覃雄派、王会举、杜小勇、王珊论文两次入选“领跑者5000—中国精品科技期刊顶尖学术论文”

新闻实体    覃雄派、王会举、杜小勇、王珊2012年1月份发表在软件学报上的论文“大数据分析——RDBMS与MapReduce的竞争与共生”分别于2013年和2017年,获得2012年度和2014年度两次入选“领跑者5000—中国精品科技期刊顶尖学术论文” (证书于2018年4月颁发给作者)。链...

2018-04-14 18:49:03

阅读数:108

评论数:0

干货——为什么降维和降维实例

参考资料https://www.scipy-lectures.org/packages/scikit-learn/auto_examples/plot_tsne.htmlhttp://colah.github.io/posts/2014-10-Visualizing-MNIST/为什么要对数据进行...

2018-04-12 15:53:16

阅读数:390

评论数:0

干货——EM算法解决混合高斯分布的参数估计

问题来由        男生女生身高数据混合在一块了,现在要把他们分开。已经知道,两者都符合高斯分布,只是参数不同(均值、方差)。问题的解决        使用EM算法。具体过程说明如下。实验        为了让读者亲自体验该算法,笔者做了一个excel文件。读者可以下载打开该文件,按照提示进行...

2018-04-10 17:17:01

阅读数:132

评论数:0

数据科学教材的流派

中文版《数据科学》、《数据科学概论》、《数据科学导论》教材,市面上还不是很多。大致可以分成3个流派,分别是数学统计学流派、档案情报流派、计算机数据库大数据流派,这三个流派及其典型代表如图所示。(1)朝乐门.《数据科学》.清华大数据出版社.2016.08;(2)欧高炎,朱占星,董彬,鄂维南.《数据科...

2018-04-08 15:22:55

阅读数:180

评论数:0

什么是数据科学?数据科学包括数据的科学和科学的数据?

什么是数据科学?众说纷纭。这是可以理解的,因为数据科学还处在创立的过程中。科学的魅力也在于此,比如物理学,从牛顿力学、到狭义相对论、到广义相对论、到量子力学,它处在不断整理、推翻、重建的的过程中,这是一个动态的过程。有专家认为,为培养人才计,数据科学专业的建立是迫在眉睫的,笔者是同意这样的看法的。...

2018-04-06 16:36:54

阅读数:146

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭