思维导图
你冻了我的冬天
剖析技术的底层原理
展开
-
Hive 运行流程总结包含优化
关键词:hive处理小文件,数据倾斜,mr程序流程,SQL解析步骤,hive优化,hive面试,hive控制map数,hive控制reduce数由于上传图片大小限制,思维导图未展开,请移步展开原创 2021-02-24 15:23:07 · 182 阅读 · 0 评论 -
Dataflow模型
Dataflow模型查看交互版本的思维导图请点击交互版连接原创 2021-02-12 20:26:31 · 1232 阅读 · 0 评论 -
特征工程
特征工程1.特征提取 :计数向量器(Countvectorizer) 、词频-逆向文件频率(TF-IDF)、词转向量(Word2Vec)2.特征转换 :连续型数据转换成离散数据、字符串和索引相互转换、正则化(Normalizer)、规范化(StandardScaler)、主成分分析 (PCA) 、向量-索引变换(VectorIndexer)、SQL转换器(SQLTransformer) 独热编码(OneHotEncoder)、最大值-最小值缩放(MinMaxScaler)特征向量合并(Ve原创 2021-02-10 19:25:04 · 321 阅读 · 0 评论 -
kafka 知识总结,以及问题总结
kafka 知识总结,问题总结kafka 知识总结,以及问题总结kafka 知识总结,以及问题总结kafka总结:消息队列,kafka架构,组件作用,为什么比磁盘快,怎么保证数据不丢失,如何手动设置offset,如何保证kafka消费顺序,kafka事务什么,搭建kafka集群等,内容持续更新。由于图片大小设置,思维导图未展开,详细请进入链接:详细思维导图...原创 2021-02-10 11:56:37 · 146 阅读 · 0 评论