两者返回的编码格式不同。 text返回的是Unicode编码,一般是在网页的header中定义的编码形式。 content返回的是byte类型,即二进制数据。 提取文本:text 保存图片、文件:content