![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 72
大锤爱编程
大胆假设,小心求证
展开
-
Python 数据可视化:玩转 Matplotlib 的散点图、线形图、饼图和热力图
我们来探讨其他几种常用的数据可视化图形:散点图、线形图、饼图和热力图。原创 2023-08-26 20:00:00 · 1747 阅读 · 0 评论 -
Pandas Power Play: 构建数据帝国的两表JOIN和group by之旅
在数据分析的过程中,常常需要把多张表格进行合并,或者按照某些规则进行分组统计。Pandas是Python中一个非常强大的数据处理库,其中的JOIN和group by函数能够帮助我们轻松地完成这些任务。本教程将详细介绍如何使用这两个函数,让你在数据分析的道路上更加游刃有余!原创 2023-05-17 19:40:00 · 560 阅读 · 1 评论 -
zsh: command not found: python问题解决
mac电脑python命令打印不出来。原创 2023-04-12 22:30:38 · 3427 阅读 · 6 评论 -
python matplotlib绘图过程中设置线条颜色
当使用matplotlib绘制图形时,我们通常需要自定义图形样式以使其更加美观和易于阅读。在本文中,我们将介绍如何自定义图形的颜色。文末有很多颜色,请大家自取🏇🏇🏇🏇最近一直在死磕数据可视化 💻,希望这些博文 📝 能够记录下我学习到的知识,同时也希望能够帮助到大家 🤗。数据可视化不仅仅是一种技能,更是一种表达想法的方式。希望大家能够通过我的分享,更好地理解和运用数据可视化,创造出更美、更有价值的可视化作品 💪。原创 2023-04-11 21:45:12 · 10094 阅读 · 15 评论 -
python数据可视化玩转Matplotlib直方图、箱型图、密度图、正态分布、偏度和峰度
目录1. 直方图、箱线图和密度图1.1 直方图1.2 箱线图1.3 密度图2. 正态分布3. 偏度和峰度结论 直方图、箱线图和密度图是数据分析中十分常用的图形。它们可以帮助我们更好地理解数据的分布情况,从而更好地进行数据分析和处理。在这篇博客中,我们将介绍它们的基本原理、用途以及如何在Python中使用代码来实现。直方图是一种常用的数据分布图,它将数据分成若干个区间,然后统计每个区间内数据的个数。通常情况下,直方图的横轴表示数据范围,纵轴表示数据出现的频数或者频率。直方图适用于连续性数据的分布情况。下面是P原创 2023-06-18 08:26:57 · 8388 阅读 · 0 评论 -
Python数据可视化——Python创建词云创建心形词云(MacWindows都可以运行)
词云是一种流行的可视化技术,用于显示文本数据中最常出现的词。在词云中,词的大小与其在文本中出现的频率成正比。词云通常用于分析和展示文本数据,例如社交媒体、新闻报道或文学作品中的关键词。形状词云是一种特殊类型的词云,它可以根据指定的形状生成。这种类型的词云非常有趣且具有吸引力,可以为您的数据可视化项目增添趣味。炫酷程度Max:形状词云简直就是时尚达人的最爱,各种创意形状让你的文本信息看起来更有吸引力,简直让人无法抗拒!专业逼格:形状词云可以用与数据集相关的形状来增强主题,让你的词云逼格瞬间翻倍。原创 2023-04-04 21:35:38 · 1754 阅读 · 12 评论 -
Pandas数据合并:concat、merge和join。两个DF怎么JOIN,DF怎么Merge
在数据处理中,经常需要将多个数据集合并成一个数据集。Pandas提供了三种方法:concat、merge和join。原创 2023-03-30 10:00:00 · 1374 阅读 · 1 评论 -
Pandas数据处理与清洗-缺失数据重复数据类型转换分组聚合
这篇文章介绍了在Pandas中进行数据处理和清洗的常用操作。主要包括缺失数据的处理、重复数据的处理、数据类型转换、列名和索引的更改以及分组和聚合操作。对于每个操作,都给出了相应的代码示例。这些操作对于进行数据分析和建模都非常重要,能够帮助我们更好地理解和处理数据。本文介绍了在Pandas中进行数据处理和清洗的常见操作。具体包括缺失数据的处理、重复数据的处理、数据类型转换、列名和索引的更改以及分组和聚合操作。对于每个操作,给出了相应的代码示例。原创 2023-03-29 14:41:36 · 249 阅读 · 4 评论 -
Pandas的DataFrame的生产,DF数据查看
使用 Pandas 的 DataFrame,可以进行以下操作:加载和处理数据,包括 CSV、Excel、SQL 数据库等格式的数据进行数据清洗、重塑、切片和切块统计数据、计算聚合和汇总信息进行数据可视化将结果保存到各种格式的文件中将数据上传到数据库或在线应用程序、以其他格式输出数据,例如 HTML 表格。原创 2023-03-23 11:08:07 · 730 阅读 · 5 评论 -
使用pandas实现滑动窗口
窗口函数(Window Function)是一种在关系型数据库中使用的函数,通常用于计算某个范围内的数据。在数据分析中,窗口函数也是一种非常有用的工具,可以轻松地对数据进行滑动窗口处理,计算移动平均值、移动总和等等。在本文中,我们将使用pandas库来实现窗口函数。pandas是一种流行的数据处理库,它提供了许多用于数据处理和分析的工具,其中包括窗口函数。原创 2023-03-22 12:00:00 · 1014 阅读 · 1 评论 -
pandas读CSV、读JSON、Excel
在本文中,我们介绍了pandas中的一些基本数据读取操作,包括读取CSV文件、Excel文件、JSON文件和SQL数据库。这些操作是使用pandas进行数据处理的基础,对于数据科学家和数据分析师来说是非常重要的。原创 2023-03-21 15:28:28 · 619 阅读 · 0 评论 -
Pandas的核心概念和核心功能Series是什么DataFrame是什么
Pandas是一个开源的数据操作和分析库。它是Python中最流行的数据科学工具之一。Pandas建立在NumPy之上,提供易于使用的数据结构和数据分析工具。在本篇博客中,我们将讨论需要掌握的核心概念和功能,以便有效地使用Pandas。一般学习这种开源框架,最好最直接的途径是去官网学习所谓的cookbook,也就是烹饪指南。这里有一个小小的文化差异点就是外国人做饭必须要看菜谱。英文ok的同学,可以直接看烹饪指南。原创 2023-03-19 12:18:02 · 507 阅读 · 5 评论 -
一文看懂描述性分析、诊断性分析、预测性分析、指导性分析
在描述性分析中,我们使用统计方法来探索数据的特征,例如数据的中心位置、离散程度、分布情况等等。在诊断性分析中,我们需要使用一些统计工具来检测数据质量问题,如缺失值、异常值、重复值等,进而决定是否对数据进行清理。预测性分析 预测性分析是根据过去的数据来预测未来的趋势或结果。在预测性分析中,我们使用一些预测模型,如回归分析、时间序列分析、聚类分析等等,来预测未来趋势。描述性分析、诊断性分析、预测性分析、指导性分析是数据分析的四个基本方向。描述性分析、诊断性分析、预测性分析、指导性分析。原创 2023-02-28 11:40:53 · 5166 阅读 · 2 评论