open()函数一般常用的几个参数open(file,mode=None,encoding=None):file是指定你要进行的文件操作中文件的路径;mode是指定你对文件操作的方法,比如:1.r:对文件进行读取操作,2.w:对文件进行写入操作,3.a:对文件进行追加操作,4.w+:写读操作,5.r+:读写操作,6.a+:追加读操作;encoding是指定你这个文件存到硬盘或者加载到你的页面上时指定的编码格式,因为python的内存中默认是Unicode编码,但是Unicode更像一个中转站,它无法进行存储和加载页面内容的操作,所以如果你要进行那些具体的操作的话,就要指定编码集,如:utf-8,gbk等,如果在encoding中你不指定编码集的话open()会自动使用你的操作系统的编码集,比如Windows的gbk,Mac的utf-8。而如果你爬取的网页的指定编码方式是utf-8,而你的电脑是Windows,而且你也没有指定编码方式,那么用gbk的编码去解析以utf-8形式存储的内容,那能不给你乱码吗?
爬虫笔记之open()
最新推荐文章于 2023-09-19 12:04:04 发布