基于正则表达式的词行词法分析|自然语言处理

最新推荐文章于 2023-05-24 23:14:58 发布

比奇堡咻飞兜

最新推荐文章于 2023-05-24 23:14:58 发布

阅读量1.4k

点赞数

分类专栏：自然语言文章标签：正则表达式 python 自然语言处理

本文链接：https://blog.csdn.net/weixin_46308081/article/details/120673485

版权

自然语言专栏收录该内容

6 篇文章 6 订阅

订阅专栏

1.任务一：邮箱地址和网址提取

1.1任务描述

$\bullet$ 实现基于正则表达式的字符串抽取，完成对 string文本的邮箱地址和网址，并按下面格式输出。

${\color{Violet}测试输入}$

(1)我的邮箱:nlp@nudt.com

(2)please click https://www.educoder.net

${\color{Violet}测试输出}$

(1)提取邮箱地址如下：
nlp@nudt.com

(2)提取网址如下：
https://www.educoder.net

1.2代码

import re
string =input()

#分别生成对应正则表达式对象
regex1 = re.compile(r'\w+@\w+.\w+')
regex2 = re.compile(r'ht{2}ps://w{3}.\w+.\w+')

res = regex1.findall(string)
if len(res):
    print('提取邮箱地址如下：')
for i in res:
    print(i)

res1 = regex2.findall(string)
if len(res1):
    print('提取网址如下：')
for i in res1:
    print(i)

2.任务二：密码提取

2.1任务描述

$\bullet$ 实现基于正则表达式的字符串抽取，完成对 string文本的密码提取，并按下面格式输出。

${\color{Violet}测试输入}$

密码是：NUDT_NLP2021

${\color{Violet}测试输出}$

提取密码是
NUDT_NLP2021

2.2代码

import re
string =input()

#提取密码代码，密码中包含字母、数字、下划线
print("提取密码是")
p = re.compile('[a-z]|[A-Z]|_|\d')
t = re.findall(p,string)
if t:
    for i in t:
        print(i,end="")

比奇堡咻飞兜

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于正则表达式的词行词法分析|自然语言处理

目录1.任务一：邮箱地址和网址提取1.1任务描述1.2代码2.任务二：密码提取2.1任务描述2.2代码1.任务一：邮箱地址和网址提取1.1任务描述∙\bullet∙ 实现基于正则表达式的字符串抽取，完成对 string文本的邮箱地址和网址，并按下面格式输出。测试输入{\color{Violet}测试输入}测试输入(1)我的邮箱:nlp@nudt.com(2)please click https://www.educoder.net测试输出{\color{Violet}测试输出}测试输出
复制链接

扫一扫