每日一题18:Pandas:字符串函数之无效的推文

核心:str.len()函数的用法。

一、每日一题 

表:Tweets

+----------------+---------+
| Column Name    | Type    |
+----------------+---------+
| tweet_id       | int     |
| content        | varchar |
+----------------+---------+
在 SQL 中,tweet_id 是这个表的主键。
这个表包含某社交媒体 App 中所有的推文。

查询所有无效推文的编号(ID)。当推文内容中的字符数严格大于 15 时,该推文是无效的。

任意顺序返回结果表。

查询结果格式如下所示:

示例 1:

输入:
Tweets 表:
+----------+----------------------------------+
| tweet_id | content                          |
+----------+----------------------------------+
| 1        | Vote for Biden                   |
| 2        | Let us make America great again! |
+----------+----------------------------------+

输出:
+----------+
| tweet_id |
+----------+
| 2        |
+----------+
解释:
推文 1 的长度 length = 14。该推文是有效的。
推文 2 的长度 length = 32。该推文是无效的。

解答:

import pandas as pd

def invalid_tweets(tweets: pd.DataFrame) -> pd.DataFrame:
    invalid_tweets = tweets[tweets['content'].str.len() > 15]
    return invalid_tweets[['tweet_id']]

题源:Leetcode 

 二、总结

str.len()函数是Pandas库中用于计算Series中每个元素的长度的一个方法。特别地,当应用于字符串类型的Series时,它会返回一个整数序列,表示每个字符串元素的字符数。这里是对str.len()函数的一些基本介绍:

功能:此函数计算字符串序列中每个元素的长度(即字符数)。
  
语法

Series.str.len()

例子:

import pandas as pd

# 示例数据
data = {'tweet_id': [1, 2, 3],
        'content': ['Hello world!', 'Just a short tweet.', 
'This is a longer tweet exceeding the typical tweet character limit...']}
tweets_df = pd.DataFrame(data)

# 应用str.len()计算推文长度
tweets_df['content_length'] = tweets_df['content'].str.len()

print(tweets_df)
   tweet_id                          content  content_length
0        1                  Hello world!                13
1        2            Just a short tweet.                18
2        3  This is a longer tweet exceeding...              60

 2024.5.21

  • 16
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值