要仔细检查 re.match(pattern, string) re.search(pattern, string), re.findall(pattern,string)
里边的参数的类型,一般都是由于类型不对造成 TypeError:的错误
TypeError: expected string or buffer
f = open('a url')
new = f.read()
derp = re.findall(r'<ol class="lh-192 trendingnow_trend-list fw-b">(.*?)</ol>', new)
line = derp
def striphtml2(data):
p = re.compile(r'\d')
return p.sub(' ', data)
new = striphtml2(line)
#removes anything in <>
def striphtml(data):
p = re.compile(r'<.*?>')
return p.sub(' ', data)
ninja = striphtml(new)
错误的原因主要是在这里new = striphtml2(line),line不是一个字符串,而是一个字符串列表,通过type查看一下便会知道,还有,要注意正则的使用,里面要求的是模式串还有要匹配的串必须是字符串类型的,错误原因其实就是类型错误,转化成str以后就可以避免了