数据科学
文章平均质量分 93
蒜蓉大猩猩
悟已往之不谏,知来者之可追
展开
-
数据科学 - 模型检验
模型检验是数据科学项目中至关重要的步骤,确保模型的质量,可靠性和实用性。模型检验的主要目的是评估模型的性能,验证其在实际应用中的效果,以及防止模型出现过拟合,欠拟合或其他潜在问题。原创 2024-08-14 14:55:11 · 1230 阅读 · 2 评论 -
数据科学 - Sklearn库总结
通过上几章对数据预处理的理解,最后来到我们数据分析的核心之一,机器学习。机器学习涵盖了许多方面,如若每一次处理都是通过手写代码的方式去处理我们的数据集是十分繁琐,复杂的。但在scikit-learn库中,提供了许多常用的机器学习模型,涵盖了分类,回归,聚类,降维等不同类型的任务。原创 2024-08-12 15:58:12 · 837 阅读 · 1 评论 -
数据科学 - 数据可视化基础
数据可视化能够将复杂的数据集转化为易于理解的图形、图表或图像。这种直观的表现形式使得人们能够更快地理解数据的分布、趋势、异常值以及数据之间的关系,从而更深入地洞察数据背后的信息。数据可视化在数据分析和决策制定过程中具有不可替代的作用。它不仅能够帮助人们更好地理解数据、识别模式和趋势、增强沟通效果,还能够辅助决策制定、提升数据质量、激发创新思维和提高工作效率。因此,掌握数据可视化技能对于数据分析师、数据科学家以及任何需要处理和分析数据的人员来说都至关重要。原创 2024-08-07 11:11:57 · 1144 阅读 · 3 评论 -
数据科学 - 数据预处理 (数据清洗,结构化数据)
数据清洗与结构化数据在数据分析和机器学习项目中扮演着至关重要的角色。随着大数据时代的到来,数据的质量、准确性和可用性成为决定项目成功与否的关键因素。原创 2024-08-03 12:06:16 · 1062 阅读 · 0 评论 -
数据科学 - 数据预处理(数据集透视,缺失值处理)
了解了数据集,才能更好的去了解通过这个数据集我们想要获得什么样的结论,运用什么样的模型,更清晰明了的解决目标问题。原创 2024-08-02 11:37:59 · 384 阅读 · 0 评论