篇始
- 不知不觉,到新的公司任数据分析师一职已有大半年的时光,在段时光中,无可避免的犯了很多错误,亦得到了许多收获。
- 今天,对于在职中的一些过错与收获进行总结,以期在日后的工作与成长过程中,能够更加的顺利。
谈谈数据分析工作需具备能力
python 与 Jupyter
- 数据整理、数据清洗、数据绘图、数据建模
- 一般用于数据量大或批量处理或数据内容复杂的时候
Excel 与 csv
- Excel是为数据分析的最基本的能力,俩种格式:xlsx,csv
- xlsx格式python读写较慢,但是胜在格式规整,很少在读写之时发生格式变化或字符编码错误的情况。
- csv格式python读写迅速,但是ptyhon在读写之时,很容易发生各种自动性的转化。
- 目前,只使用于如下俩点:
- 进行一项数据分析任务之时,将本项任务的数据从hive中的读取出来存储在excel中,起到读写方便的作用。
- 在一项任务中,需要对于任务中的一个小的方面进行查看、分析之时,直接在excel中查询无疑是瞬速,便捷的。
Tableau
- 当数据的质量较好,已经极为工整且数据量较大,并需要显示较为华丽与详细的信息,以及灵动的操作的是,使用Tableau是正确的选择。