排序:
默认
按更新时间
按访问量

《数据科学概论》教材介绍

教材    覃雄派,陈跃国,杜小勇. 《数据科学概论》.中国人民大学出版社.ISBN: 9787300252926.    官方主页:[点击链接]    CSDN博客[点击链接]    SINA博客[点击链接]    京东:[点击链接]    亚马逊:[点击链接]    当当:[点击链接]    ...

2018-03-29 17:23:25

阅读数:648

评论数:0

Windows 10上mysql绿色版zip包安装教程

1.什么是绿色版绿色版是一个zip包,解压缩到某个目标目录以后,修改好配置文件,即完成安装。无需运行安装程序。备注:本文档仅部分验证,如果有错,请通知qxp1990@ruc.edu.cn覃老师。 2.mysql绿色版安装过程在这里使用的软件包是mysql-5.5.57-winx64.zip。 2....

2018-05-26 20:10:26

阅读数:2

评论数:0

《数据科学概论》的知识体系与学习路线图

前言  知识是有架构的,这就是所谓的知识体系。学习是有路线图的(对学生而言),对老师来讲就是教学计划。 《数据科学概论》的知识体系  数据科学概论,由理论部分和应用部分构成。形成两条线索,两个T型,如图所示。  理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。  应用...

2018-05-06 15:52:40

阅读数:30

评论数:0

使用prometheus监控centos7主机

     如何对服务器硬件和软件进行监控,一款优秀的监控软件是必需的,prometheus就是这样的一款监控软件。    它支持大量的数据库、应用服务器的监控(通过...exporter,本质上是一个agent),当然prometheus也支持节点的监控,包括cpu/mem/disk/networ...

2018-05-02 20:22:48

阅读数:10

评论数:0

windows 10的python 2.7下建立python3.5环境env

// --------------------------------------------------------------------------------(1)好多软件包,目前仅仅支持python 2.7。所以,我们安装python 2.7,以便进行数据科学实验。(2)有少量的软件包,...

2018-04-30 21:39:55

阅读数:12

评论数:0

windows 10上安装配置python 2.7, keras, theano, opencv

// ---------------------------------------------------------------------------------------(1)好多软件包,目前仅仅支持python 2.7。所以,我们安装python 2.7,以便进行数据科学实验。(2)有...

2018-04-30 21:24:43

阅读数:16

评论数:0

《数据科学概论》实验参考已经陆续上线

    截至2018年4月份,“《数据科学概论》”教材(覃雄派、陈跃国、杜小勇编著)已经有9个实验参考上线,涉及分类、聚类、回归、关联规则、协同过滤、文本分析、社交网络等专题,新的实验参考也将于近期陆续上线。    感兴趣的老师和同学,可以到一下网址下载。    [下载网址]...

2018-04-19 23:13:23

阅读数:18

评论数:0

《数据科学概论》PPT已经陆续上线

   截至2018年4月份,“《数据科学概论》”教材(覃雄派、陈跃国、杜小勇编著)已经有8章PPT上线,其它章节的PPT也将于近期陆续上线。感兴趣的老师和同学,可以到一下网址下载。    [下载网址]...

2018-04-19 23:12:07

阅读数:17

评论数:0

新闻——覃雄派、王会举、杜小勇、王珊论文两次入选“领跑者5000—中国精品科技期刊顶尖学术论文”

新闻实体    覃雄派、王会举、杜小勇、王珊2012年1月份发表在软件学报上的论文“大数据分析——RDBMS与MapReduce的竞争与共生”分别于2013年和2017年,获得2012年度和2014年度两次入选“领跑者5000—中国精品科技期刊顶尖学术论文” (证书于2018年4月颁发给作者)。链...

2018-04-14 18:49:03

阅读数:23

评论数:0

干货——为什么降维和降维实例

参考资料https://www.scipy-lectures.org/packages/scikit-learn/auto_examples/plot_tsne.htmlhttp://colah.github.io/posts/2014-10-Visualizing-MNIST/为什么要对数据进行...

2018-04-12 15:53:16

阅读数:20

评论数:0

干货——EM算法解决混合高斯分布的参数估计

问题来由        男生女生身高数据混合在一块了,现在要把他们分开。已经知道,两者都符合高斯分布,只是参数不同(均值、方差)。问题的解决        使用EM算法。具体过程说明如下。实验        为了让读者亲自体验该算法,笔者做了一个excel文件。读者可以下载打开该文件,按照提示进行...

2018-04-10 17:17:01

阅读数:30

评论数:0

数据科学教材的流派

中文版《数据科学》、《数据科学概论》、《数据科学导论》教材,市面上还不是很多。大致可以分成3个流派,分别是数学统计学流派、档案情报流派、计算机数据库大数据流派,这三个流派及其典型代表如图所示。(1)朝乐门.《数据科学》.清华大数据出版社.2016.08;(2)欧高炎,朱占星,董彬,鄂维南.《数据科...

2018-04-08 15:22:55

阅读数:39

评论数:0

什么是数据科学?数据科学包括数据的科学和科学的数据?

什么是数据科学?众说纷纭。这是可以理解的,因为数据科学还处在创立的过程中。科学的魅力也在于此,比如物理学,从牛顿力学、到狭义相对论、到广义相对论、到量子力学,它处在不断整理、推翻、重建的的过程中,这是一个动态的过程。有专家认为,为培养人才计,数据科学专业的建立是迫在眉睫的,笔者是同意这样的看法的。...

2018-04-06 16:36:54

阅读数:26

评论数:0

“数据科学概论”课程设计

覃雄派,陈跃国,杜小勇. 数据科学概论.大数据,2017,06:102-111.这篇文章,描述了我们建设数据科学课程群以及数据科学概论课程的实践和体会。各位读者可以通过如下网址下载原文:点击打开链接(备注:各个高校一般已经购买了cnki的服务,在校园网可以下载论文的PDF版本)链接:《数据科学概论...

2018-04-06 14:48:10

阅读数:30

评论数:0

数据科学实践中选择Python还是R

在数据科学实践中,笔者选择Python作为编程语言。 R的优势在于,它是专门为统计分析应用建立的,尽管Python里有Scipy、Pandas、statsmodels等提供了一系列统计功能,但是R拥有更多此类工具。可以说,如果主要工作是进行统计分析,R是不错的选择。但是数据科学要用到很多机器学习的...

2018-04-04 15:34:27

阅读数:17

评论数:0

《数据科学概论》的理论篇和应用篇 - 知识体系

理论部分解决“所以然”的问题。而应用部分解决“然”的问题。我们既要知其然,还要知其所以然。链接:《数据科学概论》网上资源

2018-04-03 17:07:45

阅读数:18

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭