自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 ClickHouse学习笔记

CLICKHOUSE学习笔记2016年Yandex的开源列式数据库,用于在线分析处理(OLAP),能够用SQL查询实时生成分析报告。一、常用数据类型1、整型Int8,Int16,Int32,Int642、浮点型float32 —float(相当于mysql)float62 —double(相当于mysql)Inf—正无穷-Inf—负无穷NaN—非数字3、布尔型没有单独的类型来存储布尔值,可以使用UInt8类型 ,限制取值为0或14、字符串String–包含空字符串,可以任意长度

2021-09-10 09:20:53 152

原创 PYTHON学习笔记(一)

Python学习笔记知识图谱一、Python的基础环境及语法基础python的运行环境:python解释器、Anaconda​ python环境可以多版本共存Python的IDE:DOS\IDE\TXT\PYCHARM\JUPYTER\VSCODE\ECLIPSE语法规则:1、引入工具包import packagefrom xx import packageimport package as pk2、标识符:用于标识某一实体的符号,用于给变量、函数命名python

2021-08-05 22:48:34 108

原创 数据仓库学习笔记(二)

《数据仓库与数据挖掘教程》–黄德才数据挖掘和分析数据的属性与相似值数据集的结构1、二维表[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sW9NxSBY-1627637786028)(C:\Users\Alger\Desktop\数仓学习\数据仓库学习笔记(二).assets\image-20201026163119475.png)]2、数据矩阵[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mRkXGyDo-162763778603

2021-07-30 17:38:45 712

原创 数据仓库学习笔记

《数据仓库与数据挖掘教程》–黄德才数据仓库多源数据问题1、数据不一致:多个数据源抽数并集成得到的同一数据可能不一致2、数据属性差异:同一含义的数据在不同数据源中用了不同类型、长度或者量纲来描述3、数据重复:一个数据可以通过其他若干数据计算得到4、数据不完整5、噪声数据:测量数据时遇到的随机或其他不确定性干扰因素,导致被测量的数据产生了偏差或错误6、高维数据:即多余的属性7、模式不统一:即将集成为单一数据集的两个或多个数据源的模式不同,就称为模式不统一8、数据不平衡:某一类样本的数量明显少

2021-07-30 17:36:08 4451

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除