Python爬虫01字符串相关知识

最新推荐文章于 2022-07-06 20:15:09 发布

大大打打

最新推荐文章于 2022-07-06 20:15:09 发布

阅读量165

点赞数 1

分类专栏： Python爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47326735/article/details/107146846

版权

Python爬虫专栏收录该内容

19 篇文章 0 订阅

订阅专栏

重点：Python爬虫需要不停的和字符串打交道，所以掌握字符串相关知识尤为重要，特别是在提取数据这一块

str类型和bytes类型：

str：以Unicode的形式呈现，是我们能直观理解的

bytes：以二进制的形式呈现，网络上所有的数据传输都是用二进制的方式，难以直观理解

ASCLL:

使用1个字节表示1个字符，占用内存小，但是无法完全表示所有国家的字符，各个国家都有不同的编解码方式，使用困难

Unicode:

一律使用2个字节表示1个字符，占用内存大，几乎可以表示所有的字符，但内存占用大难以推广

UTF-8:

1.是Unicode的一种实现方式，可以理解为升级版Unicode，

2.自动识别字符个数，可以用任意字节表示1个字符，是一种变长的编码方式，并选取最小的字节

3.使内存使用最优且能够表示所有字符

赞美utf-8!!

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫01字符串相关知识

ASCLL:使用1个字节表示1个字符，占用内存小，但是无法完全表示所有国家的字符，各个国家都有不同的编解码方式，使用困难Unicode:一律使用2个字节表示1个字符，占用内存大，几乎可以表示所有的字符，但内存占用大难以推广UTF-8:1.是Unicode的一种实现方式，可以理解为升级版Unicode，2.自动识别字符个数，可以用任意字节表示1个字符，并选取最小的字节3.使内存使用最优切能够表示所有字符...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。