Pandas
文章平均质量分 68
Pandas
我的Python教程
零基础Python系列教程,喜欢的老铁可以多多点赞!
展开
-
Python教程75:Pandas中DataFrame数据的修改操作
有两个方向的标签轴,分别是行标签和列标签。每一列的标签值允许使用不同的数据类型。结构的行数、列数允许增加或者删除。2.修改DataFrame中的数据。表格型的数据结构,具有行和列。可以对行和列执行算术运算。每个数据值都可以被修改。原创 2023-11-25 19:42:10 · 1085 阅读 · 0 评论 -
Pandas教程20:数据透视表pivot_table重塑股票数据,同列不同行转化成同行不同列
1.假设有这样一个需求,股票中成交类型有bs和中性盘,把类型中"B"和"S"提取出来,分别转化为买入金额和卖出金额,同时确保不存在"B"或"S"时对应的买入或卖出金额显示为0,最后要使买入和卖出金额在同一行显示+并统计所有买单和卖单值。说的有些绕,大家跑一下代码就知道,是什么个效果了。2.另一种情况,有些股票的大单b,s,u不一定同时都有数据,如果再使用上面的方法,将无法解决问题。处理思路,我们只需要添加一个b,s,u的行数据,默认值为0,就可以万能用法了,0相加的时候是不影响最后的结果的。原创 2024-03-18 14:04:59 · 970 阅读 · 0 评论 -
Pandas教程19:groupby分组后,对列中指定关键字的组,进行求和运算。
接下来,我们对筛选后的DataFrame按’朝代列’进行分组,并对每个组的’评分列’或’年龄列’进行求和。Pandas教程07:DataFrame数据的算术运算+逻辑运算+describe()方法+统计函数+自定义函数运算。Pandas教程17:关于json数据转化成DataFrame数据,消除警告提示的方法。---------------pandas数据分析集合---------------Pandas数据化分析,DataFrame行列索引数据的选取,增加,修改和删除操作。原创 2024-03-14 10:35:09 · 1332 阅读 · 0 评论 -
Pandas教程15:多个DataFrame数据(保存+追加)为Excel表格数据
1.代码解析:1.先准备一个df1和df2数据,使用pd.concat函数进行df新旧数据合并处理,参数为多个df数据,列表类型,然后把处理后的数据打印出来。这样就可以实现数据的保存和追加操作了。索引的唯一性:每次合并时,如果新的DataFrame具有与现有数据冲突的索引,Pandas会默认重置索引或引发错误。性能考虑:循环合并多个DataFrame可能不是最高效的方法,特别是当DataFrame的数量或大小很大时。---------------pandas数据分析集合---------------原创 2024-03-14 10:32:32 · 1568 阅读 · 0 评论 -
Pandas教程:DataFrame删除重复的行数据
在Pandas中,要删除DataFrame中的重复数据,您可以使用drop_duplicates()方法。Pandas教程07:DataFrame数据的算术运算+逻辑运算+describe()方法+统计函数+自定义函数运算。Pandas教程14:DataFrame数据合并(concat+merge+_append+join)的4种方法。Pandas教程11:关于pd.DataFrame.shift(1)数据下移的示例用法。---------------pandas数据分析集合---------------原创 2024-03-12 13:42:32 · 1252 阅读 · 0 评论 -
Pandas教程17:关于json数据转化成DataFrame数据,消除警告提示的方法。
1.遇到问题:比如你爬虫某网页数据,然后将json数据转化成df数据,运行程序后,下方输出会提示如下异常警告,这个警告是关于pandas库的read_json函数的使用。Pandas教程07:DataFrame数据的算术运算+逻辑运算+describe()方法+统计函数+自定义函数运算。---------------pandas数据分析集合---------------Pandas数据化分析,DataFrame行列索引数据的选取,增加,修改和删除操作。原创 2024-03-12 13:25:24 · 1629 阅读 · 0 评论 -
Pandas教程16:DataFrame列标题批量重命名+空df数据判断+列名顺序重排
注意,rename()函数默认返回一个新的DataFrame,而不是在原地修改原始DataFrame。除了检查empty属性外,还可以检查DataFrame的行数和列数是否为零,以确定它是否为空:shape属性返回一个元组,其中shape[0]表示行数,shape[1]表示列数。如果两者都为零,那么DataFrame就是空的。3.要判断一个DataFrame是否为空数据,您可以检查DataFrame的empty属性。---------------pandas数据分析集合---------------原创 2024-03-11 12:53:00 · 1302 阅读 · 0 评论 -
Pandas教程12:常用的pd.set_option方法,显示所有行和列+不换行显示等等...
使用这个函数后,能够帮助我们更好的显示数据,帮助我们更快的认识数据,能够节省不少时间。2.举例说明,先使用numpy生成一个100行15列的DataFrame数据,然后打印一下前后的数据。Pandas教程07:DataFrame数据的算术运算+逻辑运算+describe()方法+统计函数+自定义函数运算。---------------pandas数据分析集合---------------Pandas数据化分析,DataFrame行列索引数据的选取,增加,修改和删除操作。原创 2024-02-12 12:45:30 · 2077 阅读 · 0 评论 -
Tkinter教程22:DataFrame数据加入到treeview树视图(含横纵滚动条+正反排序)
Tkinter教程21:Listbox列表框+OptionMenu选项菜单+Combobox下拉列表框控件的使用+绑定事件。------------★Tkinter系列教程★------------Python源码:教你用Tkinter创建一个简单的桌面窗口程序。Python源码:Tkinter窗口中输入框和菜单组件的使用。Python源码02:使用Tkinter制作软件的登入页面。Python源码:Tkinter组件布局管理的3种方式。Python源码04:使用Tkinter写一个计时器。原创 2024-02-07 13:12:41 · 1198 阅读 · 0 评论 -
Pandas教程11:关于pd.DataFrame.shift(1)数据下移的示例用法
pd.DataFrame.shift(1) 是 pandas 库中的一个方法,用于将 DataFrame 中的所有元素向下移动一行。可以看到,所有的元素都向下移动了一行,原来的第二行现在变成了 NaN(表示不是一个数字),因为在它们的位置上没有原来的值了。---------------pandas数据分析集合---------------Pandas数据化分析,DataFrame行列索引数据的选取,增加,修改和删除操作。输出内容:把df数据中的B列下移一个单位,并新生成的C列中,打印的结果如下显示。原创 2024-02-05 20:31:28 · 685 阅读 · 0 评论 -
Python教程:DataFrame列数据类型的转换
请注意,在进行astype操作时,应确保新的数据类型可以适应原始数据。例如,如果你试图将包含非数字字符的字符串转换为整数,那么你将会遇到错误。Pandas提供了多种数据类型转换方法。可以使用astype()函数来转换数据类型。原创 2023-11-26 17:04:33 · 2588 阅读 · 0 评论 -
Python中DataFrame数据如何转化成字符串数据
默认情况下,to_string()方法会输出一个漂亮的表格字符串,包含DataFrame的索引和列名。您可以使用index=False参数来禁用索引,header=False参数来禁用列名。要将DataFrame数据转换为字符串数据,您可以使用Pandas库中的to_string()方法。原创 2023-09-23 18:15:04 · 3804 阅读 · 0 评论 -
Python教程:DataFrame数据中使用resample计算月线平均值
在pandas库中,DataFrame可以使用resample()方法来对时间序列数据进行重采样。在上面的代码中,'M’表示按月重采样,mean()表示计算每个采样窗口的平均值。默认情况下,resample()方法使用前向填充(ffill)对缺失值进行填充,如果想要使用其他填充方法,可以通过传递fillna()函数来实现。现在,我们可以使用resample()方法来对DataFrame进行重采样。除了计算平均值,还可以使用resample()方法执行其他聚合操作,如求和、计数、最小值、最大值等。原创 2023-11-26 14:43:13 · 967 阅读 · 0 评论 -
Python爬虫教程27:秀啊!用Pandas 也能爬虫??
虽然它低调,但功能非常强大,用于抓取Table表格型数据时,简直是个神器,没有必要去F12研究HTML页面结构甚至写正则表达式解析字段。需要注意的是,该函数返回的结果是DataFrame组成的list,需要最后加上一个索引。read_html函数可以从网页中读取多个表格,并将它们存储为DataFrame对象的列表。3.pandas.read_html()函数是一个非常方便的函数,可以用于从HTML文件中提取表格数据。解析表格:使用pandas的read_html函数解析表格数据。header:标题行。原创 2023-12-02 22:01:36 · 1051 阅读 · 0 评论 -
Pandas教程07:DataFrame数据中apply参数自定义运算的用法
在上面的示例中,我们首先创建了一个包含学生数学和英语成绩的DataFrame。然后,我们定义了一个计算总分数的函数calculate_total_score,该函数接受一个行作为参数,并返回该行的数学和英语成绩之和。最后,我们使用apply方法将该函数应用于DataFrame的每一行,并将结果存储在一个新的’Total’列中。此函数可以接收一个函数作为输入,并应用于DataFrame的每一列。2.假设我们有一个包含学生数学和英语成绩的DataFrame,我们想要计算每个学生的总分数。原创 2023-11-30 12:20:56 · 962 阅读 · 0 评论 -
pandas数据转换成ndarray数组
Pandas 和 NumPy 被认为是科学计算与机器学习中必不可少的库,因为它们具有直观的语法和高性能的矩阵计算能力。要将Pandas DataFrame转换为ndarray数组,您可以使用.values属性。这将返回一个numpy数组,其元素与DataFrame中的行和列相对应。----------★★历史博文集合★★----------原创 2023-12-07 14:02:26 · 925 阅读 · 0 评论 -
Pandas教程08:使用date_range创建时间序列数据
pandas.date_range 是 pandas 库中一个非常实用的函数,用于生成一个表示日期范围的索引,可用于创建时间序列数据。normalize:布尔值,表示是否将起始日期和结束日期规范化为午夜开始的时间。start:表示日期范围的起始日期。end:表示日期范围的结束日期。dtype:生成的日期范围的 dtype。此外,还可以使用相对日期偏移量,例如’3M’表示每三个月,'2Q’表示每两个季度。periods:表示日期范围的时间数据的数量。name:生成的日期范围的名称。‘Q’:表示每季度。原创 2023-12-07 10:22:15 · 950 阅读 · 0 评论 -
Pandas教程09:DataFrame数据可视化绘制折线图、柱状图、散点图、直方图等
pandas.plot() 是 pandas 库中的一个非常方便的函数,用于绘制各种图形,例如线图、柱状图、散点图等。----------★★历史博文集合★★----------原创 2023-12-07 13:49:32 · 4365 阅读 · 0 评论 -
Pandas教程06:DataFrame.merge数据的合并处理
indicator:在合并后的 DataFrame 中添加一个指示列,指示哪些行来自左侧 DataFrame,哪些行来自右侧 DataFrame。可以是 ‘left’(左连接)、‘right’(右连接)、‘outer’(全连接)或 ‘inner’(内连接,默认)。只保留左侧DataFrame中的所有行,如果在键列中没有匹配的行,则填充NaN。保留左侧和右侧DataFrame中的所有行,如果在键列中没有匹配的行,则填充NaN。只保留右侧DataFrame中的所有行,如果在键列中没有匹配的行,则填充NaN。原创 2023-12-02 22:14:54 · 1512 阅读 · 0 评论 -
pandas中如何取需要的列数据以及转化成字符串数据
3 主板 000005 ST星源 1990-12-10 1,058,536,842 1,057,875,742 N 公共环保。1 主板 000002 万 科A 1991-01-29 9,724,196,533 9,716,577,665 K 房地产。2 主板 000004 国华网安 1990-12-01 132,380,282 126,288,093 I 信息技术。板块 A股代码 A股简称 A股上市日期 A股总股本 A股流通股本 所属行业。,您可以使用Pandas库中的to_string()方法。原创 2023-09-25 14:30:24 · 952 阅读 · 0 评论 -
Python教程73:Pandas中一维数组Series学习
s.reindex() Series 更新索引, 索引对应的值不变, 之前不存在的索引的值默认设为NaN(s的索引必须单调递增或递减)s.rename() Series 修改Series的name或索引且产生一个新的Series(应该可以本地修改, 但尝试没有成功)s.align() tuple 更新索引, 并以(new_s, new_s2)的形式返回, 缺失以nan补全。s.get() 返回s中对应索引的值, 若索引不存在则返回None或指定值。原创 2023-11-23 12:13:30 · 237 阅读 · 0 评论