R语言——字符串提取函数

最新推荐文章于 2024-01-20 13:09:03 发布

呯~哈嘿

最新推荐文章于 2024-01-20 13:09:03 发布

阅读量2.3w

点赞数 6

本文链接：https://blog.csdn.net/weixin_45534890/article/details/111478533

版权

根据身份证号计算年龄：

# 读入数据
id_number <- readxl::read_excel("D:/身份证.xlsx",sheet="Sheet1")

在这里插入图片描述

# 提取出生年份
year1 <- substr(id_number$身份证号,7,10)
# year2 <- substring(id_number$身份证号,7,10) 也是一样的

在这里插入图片描述

# 计算年龄
year <- format(Sys.time(),"%Y")  #若是输入的日期，可以使用as.Date函数将输入的日期转变为日期型，在提取出生日期

age <- as.numeric(year)-as.numeric(year1)
age

在这里插入图片描述

# 因为身份证号有规律，可以通过指定字符串中的字符位置提取规定的值;若不知道字符串的位置，可通过stringr包中的str_extract函数提取，可使用正则表达式匹配。
str_extract(id_number$身份证号,"110101")

在这里插入图片描述

str_detect(id_number$身份证号,"110101")

在这里插入图片描述
配合sum函数可计算满足条件的字符串个数。

str_locate(id_number$身份证号,"110101")

在这里插入图片描述

#可与str_locate函数配合使用，这里达到与str_extract函数函数的效果
str_sub(id_number$身份证号,str_locate(id_number$身份证号,"110101"))

在这里插入图片描述

关注