Orange3 是一款以 可视化编程 为核心的数据挖掘和机器学习工具,其界面设计直观且模块化,用户通过拖放组件(Widgets)构建数据分析流程。通过平台上的工作流,自己训练和评估模型。
Orange3 实战教程 目录
第一部分 基础部分:
第一章 文件
CSV文件导入
数据集集合
SQL表
数据表
绘制数据
数据信息
排名
编辑域
着色器
功能统计信息
保存数据
第二章 转换
数据采样器
选择列
选择行
转置
合并数据
级联
按数据索引选择
独一无二的
聚合列
分组依据:
数据透视表
应用域
预处理
公正
继续
离散化
随机化
清除域
熔化
公式
创建类
创建实例
Python脚本
第三章 可视化
树查看器
方框图
小提琴图表
分配
散点图
线条图
条形图
筛分示意图
马赛克显示器
自由可视化
线性投影
拉德维兹
热力图
维恩图
轮廓图
毕达哥拉斯树
毕达哥拉斯森林
CN2规则查看器
诺谟图
评分表查看器
第四章 模型
常量
CN2规则归纳
学习器校准
k近邻
树
随机森林
梯度增强
支持向量机
线性回归法
逻辑回归
朴素贝叶斯
评分表
AdaBoost
曲线拟合
神经网络
随机梯度下降法
堆叠
保存模型
加载模型
第五章 评估
测试和分数
预测
混淆矩阵
ROC分析
性能曲线图
校准图
排列图
参数拟合器
第六章 无监督
距离文件
距离矩阵
t-SNE
相关性
距离图
分层聚类
均值
Louvain聚类
密度聚类
流形学习
离群值
PCA主成分分析
近邻
对应关系分析
距离
距离变换
MDS多维距离
保存距离矩阵
自组织映射
第七章 光谱学
光谱
超光谱
插值
预处理光谱
积分光谱
峰值拟合
多文件
平铺文件
平均光谱
光谱干涉图
重塑贴图
信噪比(SNR)
4+角极化
第八章 文本挖掘
语料库
导入文档
创建语料库
《卫报》
纽约时报
Pubmed数据
Twitter(推特)
维基百科
预处理文本
语料库到网络
词袋模型
文档嵌入
相似性哈希
情绪分析
推文探查器
主题建模
LDA探索
语料库查看器
对文档进行评分
词汇云
一致性
文档地图
单词扩展
重复检测
单词列表
提取关键字
注释语料库地图
本体论
语义查看器
搭配词
文本统计
第九章 生存分析
作为生存数据
卡普兰-迈耶曲线图
Cox回归
等级生存特征
逐步Cox回归
队列
第十章 生物信息
数据库更新
GEO数据集
最佳表达
基因处理
差分表达式
基因本体分析
KEGG通道
基因集富集
基因集
聚类分析
火山绘图
同系物
标记基因
注解器
单个样本评分
第十一章 单细胞
加载数据
单单元数据集
过滤器
单细胞预处理
批量效果删除
对齐数据集
评分基因
记分单元格
点矩阵
空间自相关计分器
第十二章 图像分析
导入图像
图像查看器
图像嵌入
图像网格
保存图像
第十三章 网络
网络文件
网络资源管理器
网络生成器
网络分析
网络群集
群组网络
距离网络
单一模式
第十四章 Geo地图
地理编码
地理地图
等值区域图
地理变换
第十五章 教育
谷歌工作表
交互式k-均值
梯度下降
多项式回归
多项式分类
饼图
随机数据
第十六章 时间序列
雅虎财经
表单时间序列
插值
移动变换
折线图
周期图
相关图
螺旋描记图
格兰杰因果关系
ARIMA模型
VAR模型
模型评估
时间切片
差异
季节性调整
第十七章 解释
特征重要性
解释模型
解释预测
批量解释预测
相关性
第十八章 公平性
作为公平性数据
数据集偏差
重新称重
对抗性借记
均衡奇数后处理
加权逻辑回归
第二部分:进阶部分
-
文本挖掘
-
生物信息学
-
公平性
-
生存分析
-
分类
-
集群
-
分层聚类
-
Cox回归
-
散点图
-
可视化、
-
特征排名
-
交叉核验
-
神经网络
-
分类树
-
文本预测
-
文本层次聚类
-
文本模型评估
-
推特作者预测