今天在写爬虫脚本的时候,碰见了TypeError: expected string or buffer的错误,整理下来,以防忘记。
这个主要是要访问的类型错误,比如下面的代码
f = open('a url')
new = f.read()
derp = re.findall(r'<ol class="lh-192 trendingnow_trend-list fw-b">(.*?)</ol>', new)
line = derp
def striphtml2(data):
p = re.compile(r'\d')
return p.sub(' ', data)
new = striphtml2(line)
#removes anything in <>
def striphtml(data):
p = re.compile(r'<.*?>')
return p.sub(' ', data)
ninja = striphtml(new)
错误的原因主要是在这里new = striphtml2(line),line不是一个字符串,而是一个字符串列表,通过type查看一下便会知道,还有,要注意正则的使用,里面要求的是模式串还有要匹配的串必须是字符串类型的,错误原因其实就是类型错误,转化成str以后就可以避免了