![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据仓库与数据挖掘
主要针对西南交通大学计算机专业研究生课程《数据仓库与数据挖掘》。
Hillbox
这个作者很懒,什么都没留下…
展开
-
2020年西南交通大学数据仓库与数据挖掘期末考试题
1、(1)一个学生毕业十五后,他的信息仍保留在学校数据库。这种情况提出了怎样的担忧?学校应该如何解决这个错误?(2)根据数据填写元数据(3)什么是overfitting?为什么用overfitting?2、(1)事实表和维表的4个不同点(2)事实表和维表是如何设计主键的,这样设计的好处是什么?3、根据列出的事实表和3个维表画出full data cubing4、给出5个点的坐标和计算距离的欧式距离公式,一步步描述k-means算法。5、在分类的两个步骤中,class label起原创 2021-01-04 19:41:50 · 1650 阅读 · 0 评论 -
数仓小组作业(一)Mac 安装与配置JDK、SSH、MySql、Hadoop、Hive
一、安装JDK时间太久远了,直接放个参考链接https://www.jianshu.com/p/a85658902f26二、安装MySql参考链接:https://www.cnblogs.com/lilyo/p/12904439.html提示:不要用brew install mysql,会报错。1、官网下载安装包https://dev.mysql.com/downloads/mysql/下载第一个2、 双击安装包,安装时注意选择第二个:“Use...原创 2020-12-23 05:58:02 · 608 阅读 · 5 评论 -
数仓个人作业(四)使用SSAS进行OLAP分析
例子就以下面这个航班项目为例,分别进行切片、切块、钻取、旋转、移动和与移动平均值的计算一、切片(Slice)切片如下图所示:1、点它,在excel中进行分析(因为在SSAS的浏览器中,它仅显示单维数据,excel可以显示多维数据)2、拖拽“到达城市”到“行”(这里根据你的需求拖你的属性),左边出现城市的列3、拖拽“航空公司”到“列”4、拖拽“...计数”到“值”5、拖拽“飞行日期”到“筛选”6、筛选一个时间,即完成切片7...原创 2020-12-22 22:00:09 · 1415 阅读 · 6 评论 -
数仓个人作业(三)部署SSIS和SSAS项目
前言SSIS项目主要是连接SQL Server的,SSAS项目主要是部署数据仓库的。目录一、SSMS中创建数据库二、部署SSIS项目三、部署SSAS项目正文一、SSMS中创建数据库1、打开SSMS2、直接连接3、新建数据库4、起个名,确定5、右键“表”,“新建”,“表”6、以时间维表为例,创建了Time-key和Date两列之后,右键Time-key,设置为主键7、为了让主键自增,修改“标识规范”的“(是标识)”为是..原创 2020-12-21 21:30:47 · 3359 阅读 · 0 评论 -
数仓个人作业(二)SQL Server 2017 + SSDT + SSMS + VS 2017 环境搭建
前言由于我用的苹果电脑,没有SQL Server(可安装Docker运行)、SSDT、SSMS和VS 2017(只有2019版),所以直接搭建一个win10虚拟机比较方便。Mac安装win10虚拟机可以参考我的上一篇文章,链接如下:https://blog.csdn.net/qq_33514421/article/details/111143238目录并不包含VS 2017,因为SSDT的独立安装程序中带有VS 2017。SSMS是管理SQL Server数据库的工具,用来创建数据库、设计表原创 2020-12-21 04:36:14 · 1905 阅读 · 0 评论 -
数仓个人作业(一)MacOS 安装Parallels虚拟机并安装Win10
1、安装 Parallels Desktop 15 Machttps://www.zhinin.com/parallels_desktop_15-mac.html2、安装 Win10 镜像(复制到迅雷)ed2k://|file|cn_windows_10_multi-edition_vl_version_1709_updated_sept_2017_x64_dvd_100090774.iso|4630972416|8867C5E54405FF9452225B66EFEE690A|/原创 2020-12-13 18:32:41 · 440 阅读 · 0 评论