Pandas
文章平均质量分 57
IT之一小佬
敲响键盘之乐,跳起程序之舞,抵达智慧之巅!
展开
-
用pandas 制作excel透视表
用pandas 制作excel透视表原创 2023-02-19 23:23:52 · 319 阅读 · 0 评论 -
pandas汇总excel数据
pandas汇总excel数据原创 2023-02-19 23:22:14 · 221 阅读 · 0 评论 -
pandas实现execl筛选数据
pandas实现execl筛选数据原创 2023-02-19 23:21:54 · 584 阅读 · 0 评论 -
pandas根据某一列合并excel数据
pandas根据某一列合并excel数据原创 2023-02-19 23:22:49 · 534 阅读 · 0 评论 -
pandas实现excel的替换操作
pandas实现excel的替换操作原创 2023-02-19 23:22:09 · 491 阅读 · 0 评论 -
使用pandas的isna方法检查excel是否存在空值
使用pandas的isna方法检查excel是否存在空值原创 2023-02-19 23:21:44 · 293 阅读 · 0 评论 -
使用pandas的concat方法合并excel
使用pandas的concat方法合并excel原创 2023-02-19 23:21:21 · 168 阅读 · 0 评论 -
python使用pandas读写excel数据
python使用pandas读写excel数据原创 2022-09-28 22:23:48 · 5608 阅读 · 0 评论 -
根据要求合并excel表格中数据
根据要求合并excel表格中数据原创 2022-09-24 11:37:45 · 569 阅读 · 0 评论 -
使用pandas将表格中的数据进行处理
使用pandas将表格中的数据进行处理原创 2022-08-27 21:54:57 · 581 阅读 · 0 评论 -
使用python读写xlsx格式中的数据【pandas】
使用python读写xlsx格式中的数据【pandas】原创 2022-08-26 23:53:19 · 8638 阅读 · 0 评论 -
pandas对数据处理并非结构化输出
对pandas数据类型的处理,可以将数据转换成list数据类型处理,也可以使用df.apply()方法对df数据进行处理。方法一:将每列数据转换成列表类型再进行处理示例代码1:import pandas as pd# 读取excel中数据df = pd.read_excel('./test.xlsx')print(df)print("*" * 50)# 将df数据转换成list数据类型df_lst1 = df['num1'].values.tolist()...原创 2022-05-29 14:29:12 · 282 阅读 · 0 评论 -
pandas处理非结构化数据并写入CSV文件中
对于非结构化的数据类型:示例代码:import pandas as pddata1 = [1, 2, 3, 4, 5]data2 = [11, 22, 33, 44, 55, 66, 77, 88, 99]data3 = [111, 222, 333]df = pd.DataFrame({"单": data1, "双": data2, "三": data3})print(df)运行上面代码将会报下面错误:上述问题解决方法:使用from_dict()方法,行数为key值,列原创 2022-05-29 11:34:55 · 1377 阅读 · 0 评论 -
Pandas将每列数据转换成列表类型
示例代码:import pandas as pddf = pd.read_excel('./test.xlsx')print(df)print("*" * 50)# 方法一:直接用list数据类型转换df_lst1 = list(df['num1'])print(df_lst1)df_lst2 = list(df.iloc[:, 0])print(df_lst2)print("*" * 50)# 方法二:df_lst3 = df['num1'].values.tolist原创 2022-05-29 10:38:56 · 9589 阅读 · 0 评论 -
Pandas数据结构简介
import pandas as pddf = pd.DataFrame({ "Name": [ "Braund, Mr. Owen Harris", "Allen, Mr. William Henry", "Bonnell, Miss. Elizabeth" ], "Age": [22, 35, 58], "Sex": ["male", "male", "female"]})dfage...原创 2022-04-20 09:08:21 · 2063 阅读 · 0 评论 -
pandas案例分析
pandas案例分析1 需求现在我们有一组从2006年到2016年1000部最流行的电影数据数据来源:https://www.kaggle.com/damianpanek/sunday-eda/data问题1:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取? 问题2:对于这一组电影数据,如果我们想rating,runtime的分布情况,应该如何呈现数据? 问题3:对于这一组电影数据,如果我们希望统计电影分类(genre)的情况,应该如何处理数据?2 实现首原创 2021-03-01 12:44:36 · 1024 阅读 · 0 评论 -
pandas高级处理-分组与聚合
pandas高级处理-分组与聚合分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况 【在pandas中,必须连在一起说,不能单独使用,抛开聚合谈分组无意义】想一想其实刚才的交叉表与透视表也有分组的功能,所以算是分组的一种形式,只不过他们主要是计算次数或者计算比例!!看其中的效果:1 什么分组与聚合2 分组APIDataFrame.groupby(key, as_index=False) 【as_index:是否进行索引】【可以对数据进行多次...原创 2021-02-27 23:57:00 · 426 阅读 · 0 评论 -
pandas高级处理-交叉表与透视表
pandas高级处理-交叉表与透视表1 交叉表与透视表什么作用 【就是探究两列数据之间的关系】探究股票的涨跌与星期几有关?以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(用于统计分组频率的特殊透视表) pd.crosstab(value1, value2) 【返回具体数量】 透视表:透视表是将原有的Data...原创 2021-02-27 22:58:44 · 645 阅读 · 0 评论 -
pandas高级处理-合并
pandas高级处理-合并如果你的数据由多张表组成,那么有时候需要将不同的内容合并在一起分析1 pd.concat实现数据合并pd.concat([data1, data2], axis=1) 按照行或列进行合并,axis=0为列索引,axis=1为行索引 比如我们将刚才处理好的one-hot编码与原数据合并# 按照行索引进行pd.concat([data, dummies], axis=1)【这儿是紧接着上篇博文数据往下走的】2 pd.mergepd.mer原创 2021-02-27 22:28:46 · 384 阅读 · 0 评论 -
pandas高级处理-数据离散化
pandas高级处理-数据离散化1 为什么要离散化连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。【简化数据,让数据用起来更加高效】2 什么是数据的离散化连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数值代表落在每个子区间中的属性值。【把一些数据分别分到某个区间,最后用不同的符号或者数字表达】离散化有很多种方法,这使用一种最简单的方式去操作原始人的身高数据:165,.原创 2021-02-27 22:07:35 · 1081 阅读 · 0 评论 -
pandas对缺失值NaN处理
pandas高级处理-缺失值处理1 如何处理nan 获取缺失值的标记方式(NaN或者其他标记方式) 如果缺失值的标记方式是NaN 判断数据中是否包含NaN: pd.isnull(df), 【有缺失值时返回True,否则False】 pd.notnull(df) 【与isnull相反】 存在缺失值nan: 1、删除存在缺失值的:dropna(axis='rows') 注:不会修改原数据,需要接受返回值 ...原创 2021-02-22 22:32:31 · 4847 阅读 · 2 评论 -
pandas文件读取与存储
pandas文件读取与存储我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件1 CSV1.1 read_csv pandas.read_csv(filepath_or_buffer, sep =',', usecols ) filepath_or_buffer:文件路径 sep :分隔符,默认用","隔开 usecols:指定读取原创 2021-02-22 21:22:52 · 1709 阅读 · 0 评论 -
Pandas画图
Pandas画图1 pandas.DataFrame.plotDataFrame.plot(kind='line') kind : str,需要绘制图形的种类 ‘line’ : line plot (default) 【折线图】 ‘bar’ : vertical bar plot 【条形图】 ‘barh’ : horizontal bar plot 【把条形图旋转90°】 关于“barh”的解释: http://pandas.pydata.org/pandas-docs/...原创 2021-02-21 23:51:53 · 232 阅读 · 0 评论 -
Padas中DataFrame运算
Padas中DataFrame运算1 算术运算add(other)比如进行数学运算加上具体的一个数字data['open'].add(1)2018-02-27 24.532018-02-26 23.802018-02-23 23.882018-02-22 23.252018-02-14 22.49 sub(other)'2 逻辑运算2.1 逻辑运算符号例如筛选data["open"] > 23的日期数据 da原创 2021-02-21 23:39:13 · 956 阅读 · 1 评论 -
pandas基本数据操作
pandas基本数据操作为了更好的理解这些基本操作,我们将读取一个真实的股票数据。关于文件操作,后面在介绍,这里只先用一下API# 读取文件data = pd.read_csv("./data/stock_day.csv")# 删除一些列,让数据更简单些,再去做后面的操作data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"], axis=1)1 索引操作Numpy当中我们已经知道使用索引选取序.原创 2021-02-19 23:46:46 · 503 阅读 · 0 评论 -
Pandas数据结构
Pandas数据结构Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。其中Series是一维数据结构,DataFrame是二维的表格型数据结构,MultiIndex是三维的数据结构。1.SeriesSeries是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据和与之相关的索引两部分构成。1.1 Series的创建# 导入pandasimport pand原创 2021-02-19 22:49:15 · 1867 阅读 · 0 评论 -
Pandas介绍
Pandas介绍1 Pandas介绍2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 【用于数据探索】 以Numpy为基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构2 为什么使用PandasNumpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢? 增强图表可读性 回忆我们在numpy当中创建学生成绩..原创 2021-02-19 13:24:35 · 355 阅读 · 0 评论 -
pandas的基础使用
对象创建Series通过传递值列表来创建 ,让 pandas 创建一个默认整数索引:s = pd.Series([1, 3, 5, np.nan, 6, 8])sDataFrame通过传递一个 NumPy 数组、一个日期时间索引和标签列来创建一个:dates = pd.date_range("20220101", periods=6)datesdf = pd.DataFrame(np.random.randn(6, 4), index=dates, c.原创 2022-04-19 16:01:48 · 1692 阅读 · 0 评论