Python数据分析
文章平均质量分 59
哈佛在等我呢
办公小能手
展开
-
Python笔记:缺失值的处理
Python笔记:缺失值的处理原创 2022-12-02 16:53:53 · 216 阅读 · 0 评论 -
Python笔记:query查询
以下,是在Python中用query函数实现灵活查询的方法。原理不作赘述,具体请看示例。原创 2022-09-30 17:07:02 · 3502 阅读 · 0 评论 -
Python笔记:数据分列
Python数据分列原创 2022-08-31 19:45:49 · 2641 阅读 · 0 评论 -
Python笔记:数据集拼接(数据匹配)
Python笔记:数据集拼接(数据匹配)原创 2022-08-23 20:08:01 · 1298 阅读 · 0 评论 -
Python笔记:数据排名
本文简要展示一下,怎么在pandas中用rank()函数进行数据排名。原理不作赘述,具体用法请看示例:01. 构造数据集import pandas as pddf = pd.DataFrame({ "序号":range(1,11), "商品":["苹果","雪梨","荔枝","龙眼","西瓜","菠萝","黄皮","草莓","橙子","山竹"], "销量":[10,20,20,30,30,30,40,50,60,100]})df02. 算术均值排名# 相同的值排原创 2022-04-18 20:46:31 · 1807 阅读 · 0 评论 -
Python笔记:数据切片
以下是在pandas中实现数据切片的常用脚本。原理不赘述,具体示例如下:01. 构造数据集# 构造数据源import pandas as pddf = pd.DataFrame({ "序号":range(1,11), "品类":["水果","水果","水果","水果","水果","蔬菜","蔬菜","蔬菜","蔬菜","蔬菜"], "商品":["苹果","西瓜","荔枝","龙眼","菠萝","白菜","土豆","豆芽","番茄","豌豆"], "销量":rang原创 2022-04-18 15:36:08 · 3269 阅读 · 0 评论 -
Python笔记:pandas中的一些不常用的函数功能
pandas 是我们常用的一个Python数据分析库。其中有不少操作是我们平时很少用到的。如下:数据源:df一、 获取最大或最小值所对应对象的名称获取某列的最小值:df["数量"].min()获取最小值所对应的汽车品牌:df[df["数量"] == df["数量"].min()]["品牌"].values[0]获取最大值同理。 然而,我们可以使用.idxmax() 或 idxmin() 函数来更优雅得实现以上功能:df.loc[df["数量"].idxmin()]["原创 2021-11-28 19:15:11 · 319 阅读 · 0 评论 -
Python笔记:用read_html()来抓取table格式的网页数据
干货分享: #如何做出好看的Excel可视化图表(小白免费也能做出视觉炫酷的可视化图表) 更多精彩,请点击跳转到我的哔哩哔哩read_html() 的基本语法及其参数:pandas.read_html(io,match='.+',flavor=None,header=None,index_col=None,skiprows=None, attrs=None,parse_dates=原创 2021-11-26 09:56:56 · 2494 阅读 · 1 评论 -
Python笔记:Python中的数据透视表
在用Excel做数据处理的时候,数据透视表的功能很实用,Python中也有数据透视表功能。如下:预览数据源# 预览数据源df计算每个年份的平均销售数量# 计算每个年份的平均销售数量pd.pivot_table(df, index = "年份", values = "销售数量" )计算每个年份的总销售数量# 计算每个年份的总销售数量pd.pivot_table(df, index = "年份", values = "销售数量" ,aggfunc = "sum")原创 2021-11-24 10:00:40 · 1403 阅读 · 0 评论 -
Python笔记:用正则表达式把前缀或后缀的一个字母替换成其它词
示例一:import pandas as pdx = pd.DataFrame({"序号":range(1,6), "水果":["A产品", "苹果", "B产品", "西瓜", "香蕉"], "蔬菜":["白菜", "C产品", "土豆", "D产品", "冬瓜"], "水产":["河虾", "E产品", "F产品", "草鱼", "鲜蚝"], "禽类":[原创 2021-11-15 11:32:24 · 887 阅读 · 1 评论