数据挖掘复习(一)

Lcx559

已于 2023-11-17 10:54:43 修改

阅读量112

点赞数

文章标签：数据挖掘 oracle 数据库人工智能

于 2023-11-17 10:53:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lcx559/article/details/134455943

版权

第一章intro

为什么要使用数据挖掘？
当前有大量的数据被收集并储存下来，数据中蕴涵着大量可以被挖掘出的知识用于服务客户。
数据挖掘是通过挖掘获得大量数据库中有用、有益、有价值并难以理解的pattern。

Data Warehouses

A subject-oriented, integrated, cleaned collection of data in support of management’s decision making process

Application

社交媒体 2. 推荐系统 3. 医疗领域挖掘患者信息 4. 金融领域

第二章data warehouse

OLTP (on-line transaction processing)

主要任务面向于传统的数据库管理系统
每日的操作。读取写入…

OLAP (on-line analytical processing)

主要任务面向于data warehouse
数据分析以及决策指定

Distinct

OLPT-customer；OLAP-market
| OLPT | OLAP |
| customer| market |
| current, detailed | historical , consolidated|
| update | read-only but complex queries|
在这里插入图片描述

Schema

Star Schema

在这里插入图片描述

Snowflake Schema

在这里插入图片描述
snowflake schema较之star schema有了更详细的描写，属性之下还有属性

Data Cube Operation

Roll up

在某一维度上对measure进行求和

Drill down

Roll up的反向操作，把高纬度的求和数据返回为低纬度的求和数据或是详细数据。

Slice and dice

选择出其中一部分数据

图例

在这里插入图片描述

Exercise

这位师兄做了详细的作业讲解，感谢大佬分享。
https://blog.csdn.net/qq_45957458/article/details/127236288

Bitmap Index

在这里插入图片描述
将特征向量化，每一个样本的特征对应一个位图索引中的向量，根据向量来描述样本的特征。实际上是进行位运算，查询速度会大大加快

pro

通过索引映射到向量中，有效的减少了存储的空间。
通过位运算进行查询，相较于传统的查询方法有着很大的速度提高

cons

更新效率低下，由于位图索引是基于向量的，若要实现频繁的更新，则效率较低
面向高维的特征时，（类似于一个类别特征有很多个类别），位图索引可能会消耗更大的存储空间。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘复习(一)

数据挖掘期末复习
复制链接

扫一扫

Lcx559 CSDN认证博客专家 CSDN认证企业博客

码龄3年

26: 原创

150万+: 周排名

24万+: 总排名

1万+: 访问

: 等级

273: 积分

0: 粉丝

10: 获赞

9: 评论

28: 收藏

私信

关注

热门文章

最新评论

PCT: Point Cloud Transformer论文阅读及理解
沙树林: 我复现的时候为什么在取点的那个sample_and_group中最后new_points = torch.cat((grouped_points_norm, new_points), dim=-1)的时候，维度不对呢？代码中是最后一维进行连接，而我是倒数第二维才能连接
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models”听起来非常专业和引人入胜。您在深入探讨高分辨率视频合成和潜在扩散模型方面的研究上取得了显著进展，这真是令人印象深刻。在我看来，您在博客上的连续创作表明了您对这个领域的热情和扎实的研究能力。接下来，我希望能看到您在这个主题上扩展更多内容，例如探索不同的应用场景、与其他相关技术的比较或者是实验结果的进一步分析，以加深我们对高分辨率视频合成的理解。虽然我知道这需要大量的努力和时间，但我相信您的深入研究将为我们带来更多有价值的见解。请继续保持谦虚的态度，您的博客是我学习和了解最新研究进展的重要来源。期待您未来的创作，愿您在接下来的旅程中继续取得成功！
PCT: Point Cloud Transformer论文阅读及理解
小猿先森: Wv is ignored since it is a weight matrix of the Linear layer. I is an identity matrix comparable to the diagonal degree matrix D of the Laplacian matrix and A is the attention matrix comparable to the adjacency matrix E.
PCT: Point Cloud Transformer论文阅读及理解
小猿先森: 文中： Wi因为时Laplace层的权重矩阵，因此被忽视？（这里有点不懂，评论区有大佬帮忙解释一下吗）请问一下为啥呢？
GOOD: A global orthographic object descriptor for 3D object recognition and manipulation论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。