一、几个大类的任务
1. 与外界进行交互
读写各种各样的文件格式和数据库。
2. 准备
对数据进行清理、修整、规范化、重塑、切片切块、变形等处理以便进行分析。
3. 转换
对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。
4. 建模和计算
将数据跟统计模型、机器学习算法或其他计算工具联系起来。
5. 展示
创建交互式的或静态的图片或文字摘要。
一、几个大类的任务
1. 与外界进行交互
读写各种各样的文件格式和数据库。
2. 准备
对数据进行清理、修整、规范化、重塑、切片切块、变形等处理以便进行分析。
3. 转换
对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。
4. 建模和计算
将数据跟统计模型、机器学习算法或其他计算工具联系起来。
5. 展示
创建交互式的或静态的图片或文字摘要。