数据处理
文章平均质量分 65
HerrFu
Python 数据分析讲师,专注于 Python 相关领域的教与学,快来学习吧!
展开
-
数据处理系列课程 03:数据处理的科学性之初识NumPy
前面我们才提到数据处理是一件非常重要的事情,数据处理的是否得当直接关系到最终的成果,所以针对数据要做缺失值处理、离群点处理、重复值处理、噪声处理、规范化处理、离散化处理、稀疏化处理等处理,这些处理操作的基础都是建立在数学的基础上,利用数学将数据质量提高,所以今天我们要借助 NumPy 这个库。原创 2023-12-25 00:27:39 · 351 阅读 · 0 评论 -
数据处理系列课程 02:Jupyter环境搭建
Jupyter 是一个在网页端的应用程序,其以友好的交互计算和良好的数据展示而知名,可以用于代码开发、文档撰写、代码运行和结果展示。简单的说,你可以在网页中直接编写代码和运行代码,代码的运行结果也会直接在代码块下方进行展示。如果需要在编写代码的过程中编写说明文档,也可以在同一个文件中使用 Markdown 格式进行编写,而且可以直接看到渲染后的效果。此外,Jupyter 的设计初衷是提供一个能够支持多种编程语言的工作环境,目前它能够支持超过40种编程语言,包括 Python、R、Julia、Scala 等。原创 2024-01-05 10:54:40 · 727 阅读 · 1 评论 -
数据处理系列课程 01:谈谈数据处理在数据分析中的重要性
要知道无论数据有多少,我们使用的数据基本上都是来自生产、生活、商业中的实际数据,在现实世界中,由于种种原因,数据总是有这样那样的问题。所以说错误在所难免,这四大步又各自分出了一系列小步骤,像缺失值处理、离群点处理、重复值处理、噪声处理、规范化处理、离散化处理、稀疏化处理等,对数据经过一系列处理后,才能够保证数据质量最优,才能让应用者对数据分析出来的结果信服。是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解,以求最大化地开发数据的功能,发挥数据的作用。原创 2023-12-24 01:19:32 · 885 阅读 · 0 评论