1.通过字符串创建 soup=BeautifulSoup(html_str,‘lxml’) 其中’lxml’表示指定的解析方式
2.通过文件创建 soup=BeautifulSoup(open(‘index.html’))
Python中文编码问题(字符串前面加’u’)
s1=u’哈’
print s1
这样可以正确打印出’哈’字。
这里的这个u表示将后面跟的字符串以unicode格式存储。
python会根据代码第一行标称的utf-8编码识别代码中的汉字’哈’,然后转换成unicode对象。