网络评论中经常出现超链接垃圾现象,我们可以使用正则表达式进行提取
可以匹配www.[至少一个字母或数字].[至少一个字母或数字]的任意超链接
实际中存在的往往是http://www.[至少一个字母或数字].[至少一个字母或数字]但是考虑到部分www开头的现象
又因为前面的正则表达式可以包含后一种情况,所以使用的是上面的正则表达式
代码如下:
pu
网络评论中经常出现超链接垃圾现象,我们可以使用正则表达式进行提取
可以匹配www.[至少一个字母或数字].[至少一个字母或数字]的任意超链接
实际中存在的往往是http://www.[至少一个字母或数字].[至少一个字母或数字]但是考虑到部分www开头的现象
又因为前面的正则表达式可以包含后一种情况,所以使用的是上面的正则表达式
代码如下: