1、成为一名数据分析师需要具备哪些技能?
要成为一名数据分析师,需要掌握丰富的报告软件包(Business
Objects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQLite等);能够准确分析、组织、收集或传播数据;掌握数据库设计,数据模型,数据挖掘等方面的技术知识以及分析大型数据集(SAS,Excel,SPSS等)的统计软件包知识。
2、分析项目的各个步骤包括:
·问题定义
·数据挖掘
数据准备
模型化
数据认证
实施跟踪
3、列出数据清理的最佳实践?
一些数据清理的最佳实践包括:
按不同的属性排序数据。
对于大数据集,逐步清理并改进数据,直到获得良好的数据质量。
对大型数据集,可以先将其分解为小数据集,使用更少的数据将增加迭代速度。
要处理常见的清理任务,请创建一组实用程序函数/工具/脚本。它可能包括基于CSV文件或SQL数据库重映射值,或者正则表达式搜索和替换,消除所有不匹配正则表达式的值。如果在数据清理方面存在问题,请按照估计的频率进行安排并解决问题分析每列的汇总统计数据(标准差,均值,缺失值的数量),保持对每一个清理操作的跟踪,以便可以根据需要更改或删除操作。
4、数据挖掘和数据分析之间的区别是什么?
数据挖掘和数据分析之间的区别在于:
数据分析:针对个别属性的实例分析。提供有关属性的各种信息,如值范围,离散值及其频率,空值的发生,数据类型,长