每日一题
文章平均质量分 70
通过每日更新一题,要求自己每日必须学会或复习一个小知识点,达到量变到质变的目的。
锂享生活
这个作者很懒,什么都没留下…
展开
-
每日一题33:数据统计之广告效果
注意分母为0的情况时如何处理。原创 2024-06-05 00:00:00 · 129 阅读 · 0 评论 -
每日一题32:数据统计之按分类统计薪水
本题用到了cut,这里记住区间是左闭右开。2024.6.4。原创 2024-06-04 00:00:00 · 312 阅读 · 0 评论 -
每日一题31:数据统计之即时配送食物
这里用到了字符串转时间类型。python格式转换与时间类型2024.6.3。原创 2024-06-03 00:00:00 · 1043 阅读 · 0 评论 -
每日一题30:数据统计之富有客户数量
nunique()是Pandas中的一个函数,用于计算指定Series中不重复项的数量(即去除重复项后的唯一值数量)。在这个问题中,我们使用nunique()函数来计算具有至少一个订单金额大于500的唯一客户数量。我们首先对过滤后的DataFrame中的列进行统计。然后,调用nunique()方法计算该列中唯一值的数量,也就是有多少个不重复的客户ID。最终的rich_count变量就代表具有至少一个订单金额大于500的唯一客户的数量。2024.6.2。原创 2024-06-02 00:00:00 · 389 阅读 · 0 评论 -
每日一题29:数据操作之数据重塑
每日一题12:Pandas:数据重塑-融合2024.6.1。原创 2024-06-01 00:00:00 · 801 阅读 · 0 评论 -
每日一题28:数据操作之删除重复的电子邮件
这道题考察sort_values和drop_duplicates的用法。原创 2024-05-31 16:26:31 · 795 阅读 · 0 评论 -
每日一题27:数据操作之分数排名
这里用到了排序和选择所需列输出的知识。2024.5.30。原创 2024-05-30 09:01:11 · 346 阅读 · 0 评论 -
每日一题26:数据操作之部门工资最高的员工
这题考察pd.merge和pd.groupby的使用,后续会出一篇关于它们的用法。2024.5.29。原创 2024-05-29 08:49:42 · 505 阅读 · 0 评论 -
每日一题25:数据操作之第二高的薪水
该题和昨天的题类似,甚至说更简单。这里值得注意的点是[pd.NA],而不能写成['null']2024.5.28。原创 2024-05-28 07:18:37 · 414 阅读 · 0 评论 -
每日一题24:数据操作之第N高的薪水
中的 f-string 语法替换为具体值。这个修改会确保在 DataFrame 的列名中包含实际的 N 值。该表的每一行都包含有关员工工资的信息。在 SQL 中,id 是该表的主键。个最高工资,查询结果应该为。题源:Leetcode。查询结果格式如下所示。原创 2024-05-27 10:38:29 · 520 阅读 · 0 评论 -
每日一题23:统计文本中单词出现的次数
使用 str.contains()方法来查找 content列中包含匹配正则表达式 r'\sbull\s'的行。正则表达式寻找以空白字符(空格)开头和结尾的 “bull” 字符串:\s表示空白字符(比如空格、制表符等)。因此,匹配的是整个单词 “bull”,而不会匹配诸如 “bulldog” 或 “bullish” 这样的部分匹配。2024.5.26。原创 2024-05-26 14:34:34 · 569 阅读 · 0 评论 -
每日一题22:Pandas:字符串函数之患某种疾病的患者
这部分代码是选取DataFramepatients中名为conditions的列。.str:这是pandas中用于对Series(即一维数组,这里是conditions列)中的每个元素应用字符串方法的访问器。:这部分是用来检查每个conditions列的元素是否包含特定的正则表达式模式。这里的模式是\bDIAB1\b\b是边界匹配符,表示DIAB1必须作为一个完整的单词出现,而不是作为其他单词的一部分。regex=True参数表明我们正在使用正则表达式进行匹配。2024.5.25。原创 2024-05-25 14:12:48 · 791 阅读 · 0 评论 -
每日一题21:Pandas:字符串函数之查找拥有有效邮箱的用户
正则表达式(Regular Expression),简称为 regex,是一种用于描述字符串模式的表达式。它是由普通字符(例如字母、数字)和特殊字符(称为元字符)组合而成的表达式,用来匹配和查找符合特定模式的文本。正则表达式提供各种功能^:表示一个字符串或行的开头[a-z]:表示一个字符范围,匹配从 a 到 z 的任何字符。[0-9]:表示一个字符范围,匹配从 0 到 9 的任何字符。[a-zA-Z]:这个变量匹配从 a 到 z 或 A 到 Z 的任何字符。原创 2024-05-24 08:21:54 · 681 阅读 · 0 评论 -
每日一题20:Pandas:字符串函数之字修复表中的名字
这里考察str.capitalize()的使用,该方法将名字的首字母大写,其余全部小写。编写解决方案,修复名字,使得只有第一个字符是大写的,其余都是小写的。该表包含用户的 ID 和名字。名字仅由小写和大写字符组成。user_id 是该表的主键(具有唯一值的列)。返回结果格式示例如下。题源:Leetcode。具体介绍请参考另一篇。原创 2024-05-23 00:00:00 · 577 阅读 · 0 评论 -
每日一题19:Pandas:字符串函数之计算特殊奖金
核心:.loc用法。原创 2024-05-22 00:00:00 · 474 阅读 · 0 评论 -
每日一题18:Pandas:字符串函数之无效的推文
str.len()函数是Pandas库中用于计算Series中每个元素的长度的一个方法。特别地,当应用于字符串类型的Series时,它会返回一个整数序列,表示每个字符串元素的字符数。功能:此函数计算字符串序列中每个元素的长度(即字符数)。语法# 示例数据# 应用str.len()计算推文长度132024.5.21。原创 2024-05-21 00:00:00 · 606 阅读 · 0 评论 -
每日一题16:Pandas:布尔索引之从不订购的客户
本题考察布尔索引和merge的用法,merge的用法参考我的另一篇博客。另外,本题还考察rename的用法。2024.5.19。原创 2024-05-19 00:00:00 · 818 阅读 · 0 评论 -
每日一题15:Pandas:布尔索引之可回收且低脂的产品
本题考察布尔索引的运用。布尔索引步骤构建条件表达式:首先,你需要创建一个或多个表达式来表示你的筛选条件。对于数值类型的列,你可以直接比较大小;对于类别或其他类型的数据,可能需要使用.isin()等方法来匹配值。应用条件:将这些条件应用到DataFrame上,这会返回一个布尔值的Series,其中True表示该行满足条件,False则不满足。用作索引:最后,你可以直接把这个布尔Series用作DataFrame的索引来选取数据。2024.5.17。原创 2024-05-18 00:00:00 · 313 阅读 · 0 评论 -
每日一题14:Pandas:布尔索引实践之“大的国家”
本题用到了布尔索引。在Pandas中,布尔索引是一种强大的功能,它允许你根据条件选择DataFrame或Series中的数据子集。具体到本题中,如果我们有一个包含国家信息的DataFrame,并希望筛选出满足特定条件(比如面积大于300万平方公里或人口超过2500万)的“大国”,我们可以使用布尔索引来完成这一任务。布尔索引步骤构建条件表达式:首先,你需要创建一个或多个表达式来表示你的筛选条件。对于数值类型的列,你可以直接比较大小;对于类别或其他类型的数据,可能需要使用.isin()等方法来匹配值。原创 2024-05-17 00:00:00 · 296 阅读 · 0 评论 -
每日一题13:Pandas:方法链
本题用到了布尔索引以及排序函数。原创 2024-05-16 00:00:00 · 672 阅读 · 0 评论 -
每日一题12:Pandas:数据重塑-融合
将宽格式变为长格式。原创 2024-05-15 00:00:00 · 695 阅读 · 0 评论 -
每日一题11:Pandas:数据重塑-透视
数据框行列变换。原创 2024-05-14 00:00:00 · 449 阅读 · 0 评论 -
每日一题10:Pandas:重塑数据-联结
concat()是 Pandas 中一个非常强大的函数,用于沿着一个轴(行或列)组合多个对象(主要是 DataFrame 和 Series)。下面是concat()函数的基本用法、参数和一些示例。原创 2024-05-13 00:00:00 · 1219 阅读 · 1 评论 -
每日一题9:Pandas-填充缺失值
Pandas中fillna用法原创 2024-05-12 08:39:39 · 504 阅读 · 1 评论 -
每日一题7:Pandas-重命名列
介绍rename的用法原创 2024-05-10 00:00:00 · 396 阅读 · 0 评论 -
每日一题8:Pandas-改变数据类型
这里考察了apply和astype的用法。对于DataFrame,apply可以作用于整行或整列,默认是对列操作。对于本题是对整列的元素进行了四舍五入,astype是将数据类型将浮点类型转换为整形,如果不进行圆整,转换时可能会出现问题。2024.5.11。原创 2024-05-11 00:00:00 · 149 阅读 · 0 评论 -
每日一题5:Pandas-修改列
考察.loc的使用方法,查看我之前的博客.loc总结。原创 2024-05-08 00:00:00 · 375 阅读 · 0 评论 -
每日一题6:Pandas删掉重复行
这里考察drop_duplicates()的使用,具体用法查看博客。原创 2024-05-09 00:00:00 · 326 阅读 · 0 评论 -
每日一题4:Pandas创建新列
直接给出新列的名字,通过已存在的列进行数学变换后给其赋值。原创 2024-05-07 00:00:00 · 426 阅读 · 0 评论 -
每日一题3:Pandas数据获取
这里考察的是loc的用法,在我之前的博客中有写到。.loc的用法loc是基于行标签(index)和列标签(columns)进行选择的。语法:dataframe.loc[行标签, 列标签]/loc[index切片或列表,columns切片或列表]可以同时选择多行和多列逗号前面的是选择行标签,逗号后面的是选择列标签。原创 2024-05-06 00:00:00 · 615 阅读 · 0 评论 -
每日一题2:获取DataFrame的大小
在Python中,pandas是一个非常流行的数据处理库,它提供了DataFrame这一数据结构来高效地处理表格化的数据。如果想查看一个DataFrame的行数和列数,可以使用.shape来实现。原创 2024-05-05 00:00:00 · 252 阅读 · 1 评论 -
每日一题1:从表中创建DataFrame
本文通过一道题来对知识点进行拓展,方便以后直接调用。原创 2024-05-04 00:00:00 · 223 阅读 · 0 评论