基于正则表达式的词行词法分析|自然语言处理


1.任务一:邮箱地址和网址提取

1.1任务描述

∙ \bullet 实现基于正则表达式的字符串抽取,完成对 string文本的邮箱地址和网址,并按下面格式输出。

测 试 输 入 {\color{Violet}测试输入}

(1)我的邮箱:nlp@nudt.com
(2)please click https://www.educoder.net

测 试 输 出 {\color{Violet}测试输出}

(1)提取邮箱地址如下:
nlp@nudt.com
(2)提取网址如下:
https://www.educoder.net

1.2代码

import re
string =input()

#分别生成对应正则表达式对象
regex1 = re.compile(r'\w+@\w+.\w+')
regex2 = re.compile(r'ht{2}ps://w{3}.\w+.\w+')

res = regex1.findall(string)
if len(res):
    print('提取邮箱地址如下:')
for i in res:
    print(i)

res1 = regex2.findall(string)
if len(res1):
    print('提取网址如下:')
for i in res1:
    print(i)

2.任务二:密码提取

2.1任务描述

∙ \bullet 实现基于正则表达式的字符串抽取,完成对 string文本的密码提取,并按下面格式输出。

测 试 输 入 {\color{Violet}测试输入}

密码是:NUDT_NLP2021

测 试 输 出 {\color{Violet}测试输出}

提取密码是
NUDT_NLP2021

2.2代码

import re
string =input()

#提取密码代码,密码中包含字母、数字、下划线
print("提取密码是")
p = re.compile('[a-z]|[A-Z]|_|\d')
t = re.findall(p,string)
if t:
    for i in t:
        print(i,end="")
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

比奇堡咻飞兜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值