适合零基础学习的—关于正则表达式的简单练习:
url = """<div>
<p>岗位职责:</p>
<p>完成推荐算法\数据统计\接口\后台等服务器端相关工作</p>
<p><br></p>
<p>必备要求:</p>
<p>良好的自我驱动力和职业素养,工作积极主动\结果导向</p>
<p> <br></p>
<p>技术要求:</p>
<p>1\一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式</p>
<p>2\掌握HTTP协议,熟悉MVC\MVVM等概念以及相关WEB开发框架</p>
<p>3\掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种<br></p>
<p>4\掌握NoSQL\MQ,熟练使用对应技术解决方案</p>
<p>5\熟悉 Javascript/CSS/HTML5,JQuery\React\Vue.js</p>
<p> <br></p>
<p>加分项:</p>
<p>大数据,数理统计,机器学习,sklearn,高性能,大并发。</p>
</div>
"""
# # 贪婪匹配, 匹配除换行行为的全部字符
# ret = re.sub(r"<.*>", "", url)
# print(ret)
#
# # \w不能匹配空格
# ret = re.sub(r"<\w*>| ", "", url)
# print(ret)
#
# # [^>]只要不是右尖括号都匹配到
# ret = re.sub(r"<[^>]*>", "", url)
# print(ret)
#
# # \s把空白字符也替换掉
# ret = re.sub(r"<[^>]*>\s", "", url)
# print(ret)
#
# # 把 空格替换掉
# ret = re.sub(r"<[^>]*>| ", "", url)
# print(ret)
# 贪婪匹配, 匹配除换行行为的全部字符
ret = re.sub(r"<.*>", "", url)
print(ret)
# 非贪婪 ? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有
ret = re.sub(r"<.*?>", "", url)
print(ret)