核心:str.len()函数的用法。
一、每日一题
表:Tweets
+----------------+---------+ | Column Name | Type | +----------------+---------+ | tweet_id | int | | content | varchar | +----------------+---------+ 在 SQL 中,tweet_id 是这个表的主键。 这个表包含某社交媒体 App 中所有的推文。
查询所有无效推文的编号(ID)。当推文内容中的字符数严格大于 15
时,该推文是无效的。
以任意顺序返回结果表。
查询结果格式如下所示:
示例 1:
输入: Tweets 表: +----------+----------------------------------+ | tweet_id | content | +----------+----------------------------------+ | 1 | Vote for Biden | | 2 | Let us make America great again! | +----------+----------------------------------+ 输出: +----------+ | tweet_id | +----------+ | 2 | +----------+ 解释: 推文 1 的长度 length = 14。该推文是有效的。 推文 2 的长度 length = 32。该推文是无效的。
解答:
import pandas as pd
def invalid_tweets(tweets: pd.DataFrame) -> pd.DataFrame:
invalid_tweets = tweets[tweets['content'].str.len() > 15]
return invalid_tweets[['tweet_id']]
题源:Leetcode
二、总结
str.len()函数是Pandas库中用于计算Series中每个元素的长度的一个方法。特别地,当应用于字符串类型的Series时,它会返回一个整数序列,表示每个字符串元素的字符数。这里是对str.len()函数的一些基本介绍:
功能:此函数计算字符串序列中每个元素的长度(即字符数)。
语法:
Series.str.len()
例子:
import pandas as pd
# 示例数据
data = {'tweet_id': [1, 2, 3],
'content': ['Hello world!', 'Just a short tweet.',
'This is a longer tweet exceeding the typical tweet character limit...']}
tweets_df = pd.DataFrame(data)
# 应用str.len()计算推文长度
tweets_df['content_length'] = tweets_df['content'].str.len()
print(tweets_df)
tweet_id content content_length
0 1 Hello world! 13
1 2 Just a short tweet. 18
2 3 This is a longer tweet exceeding... 60
2024.5.21