![](https://img-blog.csdnimg.cn/direct/3355712c92304e5381dc1397e828f2a3.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据分析专题
文章平均质量分 92
理论和实践相结合,详细的讲解Python数据分析常用拓展库numpy、pandas、以及可视化库matplotlib,辅之以丰富的实战案例,
weixin_46863529
rm -rf *创作者
展开
-
数据分析第十四讲:数据可视化入门(三)
- Seaborn- Pyecharts原创 2024-06-21 23:23:03 · 1158 阅读 · 0 评论 -
jupyter notebook 中使用ipython 魔法指令整理
魔法指令用于在 Jupyter Notebook 中直接安装 Python 包。这些魔法指令能够极大地提高在 Jupyter Notebook 中的编程效率和便利性。魔法指令使得在 Jupyter Notebook 中安装所需的包变得非常方便,无需切换到命令行进行操作。%%script:可以在单元格中运行其他编程语言的代码,如 Bash、Perl、JavaScript 等。%notebook:导出当前 notebook 的所有历史输入到一个文件中。%conda:在单元格中安装 Python 包。原创 2024-06-20 13:24:41 · 460 阅读 · 0 评论 -
数据分析第十三讲:数据可视化入门(二)
- 高阶图表 - 气泡图 - 面积图 - 雷达图 - 玫瑰图 - 3D图表原创 2024-06-20 01:40:39 · 770 阅读 · 0 评论 -
数据分析第十二讲 数据可视化入门(一)
- 安装和导入matplotlib- 创建画布- 创建坐标系- 绘制图表 - 折线图 - 散点图 - 柱状图 - 饼状图 - 直方图 - 箱线图- 显示和保存图表原创 2024-06-19 23:42:00 · 1142 阅读 · 0 评论 -
数据分析第十一讲:pandas应用入门(六)
类型的索引,那么你就很有可能要对数据进行时间序列分析,关于时间序列分析的方法和模型并不是本章节要探讨的内容,我们在其他的专栏中为大家分享。方法基于时间对数据进行重采样,相当于根据时间周期对数据进行了分组操作,分组之后还可以进行聚合统计,代码如下所示。方法指定一个时间频率来实现对数据的抽样,我们仍然以之前讲过的百度股票数据为例,给大家做一个演示。的方法,可以给索引指定一个顺序,分组聚合的结果会按照这个指定的顺序进行呈现,代码如下所示。三个参数即可,分别表示作为索引的数据、索引的数据类型和索引的名称。原创 2024-06-19 23:30:22 · 1200 阅读 · 0 评论 -
数据分析第十讲:pandas 应用入门(五)
- 计算同比环比- 窗口计算- 相关性判定原创 2024-06-17 13:22:11 · 1282 阅读 · 0 评论 -
数据分析第九讲:pandas 应用入门(四)
- 数据透视 - 获取描述性统计信息 - 排序和头部值 - 分组聚合 - 透视表和交叉表- 数据呈现原创 2024-06-17 13:12:27 · 1258 阅读 · 0 评论 -
数据分析第八讲:pandas 应用入门(三)
- 数据重塑 - 数据拼接 - 数据合并- 数据清洗 - 缺失值 - 重复值 - 异常值 - 预处理原创 2024-06-16 19:43:50 · 979 阅读 · 0 评论 -
数据分析第七讲:pandas应用入门(二)
- 创建`DataFrame`对象- `DataFrame`对象的属性和方法- 读写`DataFrame`中的数据原创 2024-06-16 19:30:43 · 743 阅读 · 0 评论 -
数据分析第六讲:pandas应用入门(一)
- 创建`Series`对象- `Series`对象的运算- `Series`对象的属性和方法原创 2024-06-16 19:28:40 · 827 阅读 · 0 评论 -
数据分析第五讲:numpy的应用入门(四)
NumPy的应用(四)向量向量(vector)也叫矢量,是一个同时具有大小和方向,且满足平行四边形法则的几何对象。与向量相对的概念叫标量或数量,标量只有大小,绝大多数情况下没有方向。我们通常用带箭头的线段来表示向量,在平面直角坐标系中的向量如下图所示。需要注意的是,向量是表达大小和方向的量,并没有规定起点和终点,所以相同的向量可以画在任意位置,例如下图中w\boldsymbol{w}w和v\boldsymbol{v}v两个向量并没有什么区别。向量有很多种代数表示法,对于二维空间的向量,下面几种写法都原创 2024-06-16 19:20:43 · 876 阅读 · 0 评论 -
数据分析第四讲:numpy的应用入门(三)
函数的第一个参数设置了两个条件,满足第一个条件的元素执行了乘以10的操作,满足第二个条件的元素执行了求平方的操作,两个条件都不能满足的数组元素会被处理为0。属性)是完全相同的,我们再来研究一下,两个形状不同的数组是否可以直接做二元运算或使用通用二元函数进行运算,请看下面的例子。NumPy 的数组跟数组也可以执行算术运算和关系运算,运算会作用于两个数组对应的元素上,这就要求两个数组的形状(函数的第一个参数给出了条件,满足条件的元素执行了乘以10的操作,不能满足条件的元素执行了求平方的操作。原创 2024-06-15 23:28:52 · 835 阅读 · 0 评论 -
数据分析第三讲:numpy的应用入门(二)
all()any()方法:判断数组是否所有元素都是True/ 判断数组是否有为True的元素。astype()方法:拷贝数组,并将数组中的元素转换为指定的类型。reshape()方法:调整数组对象的形状。dump()方法:保存数组到二进制文件中,可以通过 NumPy 中的load()函数从保存的文件中加载数据创建数组。array3tofile()方法:将数组对象写入文件中。fill()方法:向数组中填充指定的元素。flatten()方法:将多维数组扁平化为一维数组。nonzero()原创 2024-06-15 23:22:28 · 627 阅读 · 0 评论 -
数据分析第二讲:NumPy的应用入门(一)
关于索引运算需要说明的是,切片索引虽然创建了新的数组对象,但是新数组和原数组共享了数组中的数据,简单的说,无论你通过新数组对象或原数组对象修改数组中的数据,修改的其实是内存中的同一块数据。花式索引和布尔索引也会创建新的数组对象,而且新数组复制了原数组的元素,新数组和原数组并不是共享数据的关系,这一点可以查看数组对象的。对象可以进行索引和切片操作,通过索引可以获取或修改数组中的元素,通过切片操作可以取出数组的一部分,我们把切片操作也称为切片索引。布尔索引就是通过保存布尔值的数组充当一个数组的索引,布尔值为。原创 2024-06-15 23:16:06 · 810 阅读 · 0 评论 -
Python环境准备
安装Anaconda,或者pip安装jupyter 工具入门数据分析原创 2024-06-15 23:01:02 · 580 阅读 · 0 评论 -
数据分析第一讲:数据分析概述
当今世界对信息技术的依赖程度在不断加深,每天都会有大量的数据产生,我们经常会感到数据越来越多,但是要从中发现有价值的信息却越来越难。这里所说的信息,可以理解为对数据集处理之后的结果,是从数据集中提炼出的可用于其他场合的结论性的东西,而从原始数据中抽取出有价值的信息的这个过程我们就称之为数据分析,它是数据科学工作的一部分。数据分析是有针对性的收集、加工、整理数据并采用统计、挖掘等技术对数据进行探索、分析、呈现和解释的科学。原创 2024-06-15 22:49:38 · 1256 阅读 · 0 评论