Python高级开发————正则表达式
正则表达式主要用于过滤文本,将无效信息过滤,保留有效信息。如机器学习中的垃圾邮件分类。
需求
有一批网址:
http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6http://www.fincm.com/newslist.asp?id=415
需要正则后为:
http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/
2、匹配合法的ip地址
3、匹配所有合法的电子邮件地址
4、打开test.txt文本,将里边得文本使用正则表达式筛选出数字,再存入test1.txt文件中。
实现
import re
str=’’‘http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=