数据分析
文章平均质量分 74
Efred.D
Never
展开
-
数据分析之分组groupby方法
本文使用 python 3, pandas 1.3.5 , numpy 1.22.0库文章目录前言一 、groupby使用公式二、python实现2.1 直接对分组数据做聚合运算2.2 对分组数据做自定义运算前言pandas.DataFrame.groupby方法就是DataFrame类型或者Series类型根据index/column 进行分组,然后对某列/某些列进行处理的过程一 、groupby使用公式**需要处理的某列或者某些列.groupby(作为分组标准的列/作为分组标准的列的lis原创 2022-03-07 13:33:04 · 2884 阅读 · 0 评论 -
数据分析之滚动窗口pandas.DataFrame.rolling方法
本文使用pandas 1.3.5 , python 3, numpy 1.22.0库文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步原创 2022-02-03 22:54:03 · 8079 阅读 · 0 评论 -
数据分析之datetime库的常见使用--字符串和datetime类型数据的相互转化
font color=#999AAA >说明:本blog基于python3文章目录前言一、字符串转化为datetime类型数据二、datetime类型数据转化为字符串总结前言本文主要介绍datetime模块的字符串和datetime相互转化功能。一、字符串转化为datetime类型数据使用datetime.datetime.strptime(字符串,目标格式)方法其中,目标格式有如下多种%Y 四位年份%y 二位年份%m 二位月份%d 二位日期%H 24小时制%I 12小时制原创 2022-02-03 17:18:07 · 2200 阅读 · 0 评论 -
详解Matplotlib库的使用
说明:本blog基于python3,matplotlib 3.5.1, numpy 1.22.0文章目录前言一、创建(初始化)图表对象1.1 在新图表中逐个新的子图表1.2 在图表中创建行,列共享坐标的子图表二、对每个子图进行绘图(折线图)三、对子图进行进一步加工四、图片保存总结前言可视化操作广泛应用于数据分析和机器学习中,它可以帮助人们更直观地观测到异常值或所需地数据转换效果;matplotlib作为python的一个桌面绘图包,可以生成出版级质量的图表;该工作包与2002年由John Hunt原创 2022-01-13 20:00:29 · 748 阅读 · 0 评论 -
Pandas常见方法(5)-DataFrame逐列填补Nan值
说明:本blog基于python3版本, pandas 1.3.5文章目录前言代码实例前言我们在日常工作中,拿到第一手的数据集通常有很多nan值;本文介绍一种根据DataFrame2 来 逐列填补DataFrame1 中nan 值的方法,公式: DataFrame1.combine_first(DataFrame2), 返回一个DataFrame1和DataFrame2 长度,宽度分别取DataFrame1和DataFrame2最大值的新的DataFrame代码实例import panda原创 2022-01-12 10:30:30 · 3699 阅读 · 0 评论 -
numpy.hstack VS numpy.vstack VS numpy.dstack 的应用比较,超清晰~
闲话少说,直接上重点;hstack,vstack 和dstack是numpy的常见的三个numpy.array 的拼接方式;不同点是,hstack是从水平(horizon)维度进行拼接,相当于numpy.concatenate(, axis = 1); vstack是从垂直(vertical)维度进行拼接,相当于numpy.concatenate(, axis = 0);dstack是从第三个维度,深度(deep)维度进行拼接,相当于numpy.concatenate(, axis = 2);另外,需注意原创 2021-11-11 15:30:03 · 723 阅读 · 0 评论 -
Pandas常见方法(4)-DataFrame数据的拓展,拼接与常见统计量
Python数据分析摘要(2)声明:以下内容都是基于python3.8版本。文章目录前言一、pandas.DataFrame在index或column两个维度上的拓展二、pandas.DataFrame的join和group方法三、pandas.DataFrame的常用统计方法总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一原创 2021-01-03 21:46:07 · 3179 阅读 · 0 评论 -
Python数据分析摘要(1)- DataFrame数据定位,筛选和修改
数据分析在社会和经济生活中扮演着越来越重要的角色。因此,我在接下的几篇blog中阐释比较常用的数据分析的代码,如有不妥,欢迎指正!数据分析第一个常用的库是pandas。 相比较numpy和matplotlib, 在产生相同效果的同时,pandas 体现出强大的API 功能,获取数据的途径更加便捷,所以备受推崇。首先,我们来了解一下 pandas 中 DataFrame这个类的一些基本情况。DataFrame来源于R语言的data.frame类,因此自身功能多样。其次,介绍一下DataFrame对象的数原创 2020-12-18 21:16:08 · 4369 阅读 · 1 评论