文本操作

1240
1240

os的使用

1240

上下文管理器

1240
自定义一个上下文管理器

class File():

    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        print("entering")
        self.f = open(self.filename, self.mode)
        return self.f

    def __exit__(self, *args):
        print("will exit")
        self.f.close()

装饰器下的上下文管理器

from contextlib import contextmanager

@contextmanager
def my_open(path, mode):
    f = open(path, mode)
    yield f
    f.close()

调用:
with my_open('out.txt', 'w') as f:
    f.write("hello , the simplest context manager")

编码问题

背景

计算机只能处理数字,因此处理文本必须转换成数字才行,最早的计算机在设计时采用8比特作为一个字节 8bit >> 1 bytes
而计算机采用的是二进制,所以一个字节可以表示256种不同的状态。每一个状态对应一个符号,
从 0000 0000 -1111 1111
美国人发明了计算机,同时制定了编码,以对应英文字符和二进制的关系,这就是ASCII码,一共规定了128个字符的编码
128个字符表示英文足够了,但是中文有超过十万个汉字,一个字节只能表示256种符号,所以,中国使用的是GB2312作为简体中文的常见编码形式,用两个字节表示一个汉字, 256*256=65536个符号,
但是各个国家的编码是不一样的,为了能够各国跨语言,跨平台的进行文本转换处理,就有了Unicode
Unicode被称为统一码,万国码
通常是两个字节,
ASC码转Unicode码就是在之前加0
应为在ASC中英文字母只需要一个字节就足够了,但是Unicode是两个,这样存储很浪费,
这样为了节省空间,开发了一些中间格式的字符集,这就是通用转换格式 Unicode transformation format( UTF) 常见的有utf-8。utf-16
1240

转载于:https://www.cnblogs.com/0916m/p/11481778.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值