啥是数据处理工具?
- 数据处理是指运用工具加工数据来解决问题的流程。
- 何为工具?工具是指达到目的所借助的器具。荀子曰:“君子生非异也,善假于物也。”
- 我曾写过文章谈到对于“器”的看法:知其性,得其法,因时而用,是谓养器。
- 数据处理工具是按需求对数据进行增删改查操作的工具。熟练操作数据处理工具的能力被称为数据处理能力。
- 数据处理工具的功能:存储数据、查询数据、增加数据、修改数据、删除数据、展现数据。
- 存储数据:以文件形式存储在设备中,便于能够反复操作。常见文件格式:.docx、.xlsx、.pptx、.csv、.txt、.sql等。
- 查询数据:按需求以过滤方式获取数据的过程。过滤条件分为:符合条件过滤、排除条件过滤。
- 增加数据:按照原有数据格式添加新的数据记录的过程。增加方式分为:插入、追加。
- 修改数据:修改与事实不符数据记录的过程。修改内容分为:记录值修改、字段类型修改。
- 删除数据:删除没有利用价值的数据记录。删除类型分为:逻辑删除、实体删除。删除数据本质上是一种过滤查询的方式。
- 展现数据:数据规律以表格或图表的形式展现的过程。原则是“字不如表,表不如图”。数据展现的本质是视觉效果和心理暗示。
SQL
- SQL(Structured Query Language)结构化查询语言,是一种用来访问和操作数据库系统的语言。
- 不同的数据库管理系统(DBMS),具有不同的SQL:Oracle、MySQL、SQL Server、Redis、MongoDB等。
- 数据分析工具中SQL的学习之所以重要,原因是各行各业的信息化系统的普及。数据库管理系统可比作是信息化系统的“仓库”。
- 学习SQL的本质需求是可以直接、方便、快捷地操作数据库管理系统中数据,SQL是获取数据的手段之一。
- SQL学习重点:数据类型、数据库表关系、数据库表及数据的增删改查、SQL函数、存储过程、数据权限管理。
Python
- Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。
- 解释型相对于编译型而言;面向对象相对于面向过程而言;动态数据类型相对于静态数据类型而言。
- 数据分析为啥要学Python?**因为懒惰!**任何一门高级编程语言都可以做数据分析。程序世界的本质就是处理数据信息。
- 学习Python的本质需求是面向对象和Packages。Packages最恰当的意思是“必须整体接收的一套东西”。
- Python学习重点:数据类型、条件和循环语句、函数(方法)、面向对象编程设计(OOP)、Numpy、Pandas、Matplotlib。
Excel
- Excel可谓是家喻户晓的一个工具。作为Office办公软件的扛把子,每个人对它的认识程度都不同。
- Excel的菜单功能是我目前接触到软件中最多的!平时的工作需求,最多利用Excel功能的10%左右就能完成。
- Excel在数据分析中的地位,相当于游戏玩家刚进入新手村的首套装备。凭借一身Excel技能行走江湖的能人数不胜数,不知为何Excel却成为了数据分析技能鄙视链的最底端。
- Excel,作为英文单词的解释是“擅长、突出”。ex-前缀一般是从……中抽出;cel其实是指cell,单元格。个人理解:Excel是把数据价值从单元格Cell中抽取出来的工具。
- 学习Excel的本质需求是高效快捷的进行数据组织、数据处理和数据展示。
- Excel学习重点:三大表(明细表、参数表、汇总表)数据组织方式、单元格引用、单元格属性、数据透视表、公式、图表、筛选排序查找替换。
BI
- BI(Business Intelligence,商业智能),这个词1996年提出的。但是BI在国内被广泛熟知的时间是近十年左右。
- BI工具的出现并非偶然,而是一种必然。数据量骤增、数据价值凸显、数据安全意识增强等一系列因素,对数据处理速度和数据安全性提出巨大的挑战,此时BI应运而生。
- 目前主流的BI工具主要有:Tableau、Power BI、FineBI、QlikView等。
- 学习BI工具的本质需求数据处理能力强、联机在线分析处理(OLAP)、交互式数据可视化效果。
- BI工具学习重点:SQL基础、计算字段、图表样式、内置函数功能、数据联动钻取、数据讲故事能力。