场景
使用requests爬取网页+beautifulsoup4解析。
出现网页内中文乱码问题
解决步骤
1. 在网页页面点击右键 查看网页源代码
2.查看编码方式
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="content-type" content="text/html;charset=GB2312"/>
从第四行代码可以看到网页编码是GB2312方式
3.修改代码
在request获取页面之后修改 encoding为GB2312即可