爬虫笔记之open()

           open()函数一般常用的几个参数open(file,mode=None,encoding=None):file是指定你要进行的文件操作中文件的路径;mode是指定你对文件操作的方法,比如:1.r:对文件进行读取操作,2.w:对文件进行写入操作,3.a:对文件进行追加操作,4.w+:写读操作,5.r+:读写操作,6.a+:追加读操作;encoding是指定你这个文件存到硬盘或者加载到你的页面上时指定的编码格式,因为python的内存中默认是Unicode编码,但是Unicode更像一个中转站,它无法进行存储和加载页面内容的操作,所以如果你要进行那些具体的操作的话,就要指定编码集,如:utf-8,gbk等,如果在encoding中你不指定编码集的话open()会自动使用你的操作系统的编码集,比如Windows的gbk,Mac的utf-8。而如果你爬取的网页的指定编码方式是utf-8,而你的电脑是Windows,而且你也没有指定编码方式,那么用gbk的编码去解析以utf-8形式存储的内容,那能不给你乱码吗?

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值