- 什么是数据挖掘
- 以数据作为研究的对象,从数据中寻找价值,获取知识的过程,至于说机器学习算法,或者数据的统计分析,这些都是手段
- 数据挖掘的流程
- 理解业务
- 认识清楚我们要完成的业务目标,能够为我们后面的提升效率、优化效果带来非常大的帮助
- 理解数据
- 准备数据
- 把原始的数据经过清洗加工,转变成我们在后面的建模环节所需要的状态
- 构建模型
- 分类
- 聚类
- 回归
- 关联分析
- 模型评估
- 部署上线
- 下一次迭代
- 理解业务
———————————————————————————————————————————
- 图表的优点
- 简化数据
- 加强记忆
- 易于理解
- 突出重点
- 不同场景下的可视化工具
- 开发者个人数据可视化
- Matplotlib
- Seaborn
- 业务分析型数据可视化
- Tableau
- 动态数据展示可视化
- Echarts
- 开发者个人数据可视化
- 可视化的建议
- 关于可视化图表的选型
- 类别比较
- 柱形图
- 条形图
- 雷达图
- 词云图
- 数据关系
- 数值关联分析需求
- 散点图
- 气泡图
- 曲面图
- 当要对比的变量超过三个
- 星形图
- 平行坐标系
- 矩阵散点图
- 层次关系
- 节点链接图
- 树形图
- 冰柱图
- 旭日图
- 网络关系
- 桑基图
- 蜂箱图
- 数值关联分析需求
- 数据分布
- 直方图
- 密度曲线图
- 箱型图
- 时间序列
- 折线图
- 面积图
- 雷达图
- 日历图
- 柱形图
- 局部整体
- 饼图
- 环形图
- 旭日图
- 矩形树状图
- 地理空间
- 地图作为底图,然后辅助以热力图或者散点图进行对比
- 类别比较
- 关于颜色的搭配
- 最好使用既定的色彩主题
- 去一些配色网站上寻找你想要的配色方案
- 使用公司提供的配色方案
- 关于可视化图表的选型