- 博客(7)
- 资源 (3)
- 收藏
- 关注
原创 数据存储概况
一.物理存储与读写瓶颈1.磁盘(固态硬盘,机械硬盘)(1)磁盘寻址:毫秒级别(2)磁盘IO:百兆级别(3)磁盘读写方式:顺序读写(慢),随机读写(快)2.内存(1)内存寻址:纳秒级别3.解决思想分治...
2020-03-29 11:53:13 258
原创 德哥PostgreSQL学习资料汇总(转)
文章来自:https://yq.aliyun.com/articles/59251?spm=5176.100239.bloglist.95.5S5P9S德哥博客新地址:https://billtian.github.io/digoal.blog/德哥介绍:周正中,网名德哥 ( digoal ),目前就职于阿里云。PostgreSQL 中国社区发起人之一,PostgreSQL 象牙塔发起人之...
2020-03-26 09:24:42 1237
转载 HASH JOIN MERGE JOIN NESTED LOOP
多表连接的三种方式详解 HASH JOIN MERGE JOIN NESTED LOOP多表之间的连接有三种方式:Nested Loops,Hash Join 和 Sort Merge Join. 下面来介绍三种不同连接的不同:一. NESTED LOOP:对于被连接的数据子集较小的情况,嵌套循环连接是个较好的选择。在嵌套循环中,内表被外表驱动,外表返回的每一行都要在内表中检索找...
2020-03-22 16:04:20 89
原创 德哥 posgresql视频教程笔记
第二章:1.逻辑分层:(1)Cluster(2)Database(3)Schema(4)Table,Index,View,Function,Sequence(5)Rows,Columns2.物理分层:(1)每一个Table,Toast,Index,Sequence对应一个或多个datafile;(2)Archives对应Wals归档日志文件。3.进程:(1)postmaster:监...
2020-03-21 19:12:00 335
原创 hadoop权威指南-阅读笔记
一 Map-Reduce两个阶段都是键值对。Map把数据打散,Reduce对相同键的数据做聚集计算。二 HDFS1.高延时,数据不可修改(追加)。2.
2020-03-20 11:38:53 72
原创 《特征工程》笔记
一 简单的数据技巧1二值化2固定宽度装箱3分位数和中位数(数据均衡)4对数转换(功率变换)5min-max缩放:归一化6标准化:方差缩放7缩放:L2范数8交互特征:特征的积,类似逻辑与9特征选择 (1)Filtering(过滤)(2)Wrapper methods(包装方法):不断用特征子集试验。可采用算法:随机策略进行子集搜索(Las Vegas Wrappe...
2020-03-18 17:32:37 101
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人