2020年12月14日 — 2020年12年20日
收集GNN的相关学习资料,针对GNN的GCN应用技术进行深入学习,这里考虑到要熟悉图结构和图建模,之后还要熟悉以下图论里面的相关知识;
梳理GNN的学习博客(完成后再开放)
下周计划对两篇GCN的论文代码,进行复现学习;继续收集智慧学习相关论文,拓展方法论;
Semi-Supervised Classification with Graph Convolutional Networks
Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering
其他实践总结
BI的优势:
现在的BI更适合被翻译成Business Information 而不是Business Intelligence
数据孤岛的打通 自动化的数据采集 与处理流程报表开发效率的提升 更为先进的多维数据分析理念 信息呈现方式的多样化
虽然传统BI与智能无多大关系,但大数据处理技术手段的多样化与AI(人工智能)技术的长足进步,使得建立一个真正能够模拟人类心智的数据分析体系成为可能。不过必须注意到,很多诸如自动化流程、高密度计算、条件触发逻辑等传统非AI方式均能完成的功能都被冠以AI之名,这只不过是打着AI幌子的噱头而已。真正的AI,一定是能够模拟人类的心智,使其某种程度看上去像一个真正的人(Like humans)。
数据建模:(借鉴了邦格科技博客)
现实表:保存度量值或现实结果的表,称为现实表,保存大量的行;
维度表:记录描述性的信息,保存大量的列;
一、数据立方体(Cube)
面向一个业务主题的数据集合
1.1维度(Dimension)
不同的分析角度,也就是业务维度,如对授课业务建模,至少会有学生、教师、课程维度,可以理解为Cube中的边(或者某个坐标轴)。
1.1.1 维度成员(Member)
指维度中具体的成员属性,日期维度中具体的年份、季度、月份、日就是日期维度成员(member),如:2018年、2018年3季度、2018年10月份、2018年10月1日都是日期维度成员,可以理解为Cube边上的某个点(或者坐标轴上的某个点)。
1.1.2 成员级别(Level)
表示成员的级别信息,也就是描述级别的详细程度,还是以日期维度为例子,2019年、2020年、2021年,这里日期维度的Level就是年;2019年9月,2019年10月,这里的日期维度的Level就是月。
1.1.3 维度层次体系(Hierarchy)
指维度的层次体系结构,如下展示了日期维度两种不同的层次体系
1.1.4 维度角色(DimensionRole)
指维度关联到数据立方体上所扮演的角色,如下图:表示人口迁移的数据模型,其中户籍迁入地和户籍迁出地都是地区维度,但是关联到数据模型上就会扮演不同的角色,任何多维数据模型,维度都是通过维度角色关联到Cube上的;
1.2度量(Measure)
能精确化用数值表示的信息,如小票cube中商品的购买数量、商品单价、消费总额;
1.2.1度量维度(MeasureDimension)
表示度量值的维度,对于具有多个度量值的多维数据模型,可以将其度量信息单独提取并作为一个独立的维度,将数据模型进行升维;
转换为二维表结构(模型适合柱状图可视化) ->
转换为二维表结构(模型适合饼图可视化) ->
可以将度量与维度互换,互换后的模型与原形态具有完全相同的分析能力
还可以将普通维度变换为度量,可以将原Cube降维,降温后的Cube同样具有与原形态一样的分析能力
1.2.1 度量角色(MeasureRole)
度量维度关联到Cube上带有的角色信息