01_python数据模型

最新推荐文章于 2023-04-30 08:26:42 发布

程序小小白呀

最新推荐文章于 2023-04-30 08:26:42 发布

阅读量172

点赞数

分类专栏： python学习

本文链接：https://blog.csdn.net/weixin_41814736/article/details/103974551

版权

python学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

数据模型：是对Python框架的描述，它规范了这门语言自身构建模块的接口，这些模块包括但不限于序列、迭代器、函数、类和上下文管理器。

Python解释器碰到特殊的句法时，会使用特殊方法去激活一些基本的对象操作，这些特殊方法的名字以两个下划线开头，以两个下划线结尾（例如__getitem__）。比如obj[key]的背后就是__getitem__方法

1.1 一摞Python风格的纸牌

import collections
Card = collections.namedtuple('Card', ['rank', 'suit'])
class FrenchDeck: 
	ranks = [str(n) for n in range(2, 11)]+list('JQKA') 
	suits = 'spades diamonds clubs hearts'.split() 
	def __init__(self):
		self._cards = [Card(rank, suit) for suit in self.suits for rank in self.ranks]
	def __len__(self): 
		return len(self._cards) 
	def __getitem__(self, position): 
		return self._cards[position]

1、自Python 2.6开始，namedtuple就加入到Python里，用以构建只有少数属性但是没有方法的对象，比如数据库条目。
2、从一叠牌中抽取特定的一张纸牌，比如说第一张或最后一张，是很容易的：deck[0]或deck[-1]。deck为类的FrenchDeck的实例对象。
3、Python已经内置了从一个序列中随机选出一个元素的函数random.choice,__getitem__与__len__其实就是序列协议。
4、因为__getitem__方法把[]操作交给了self._cards列表，所以我们的deck类自动支持切片（slicing）操作。
5、另外，仅仅实现了__getitem__方法，这一摞牌就变成可迭代的了，反向迭代也没关系。

迭代通常是隐式的，譬如说一个集合类型没有实现__contains__方法，那么in运算符就会按顺序做一次迭代搜索。

我们通过数据模型和一些合成来实现这些功能。通过实现__len__和__getitem__这两个特殊方法，FrenchDeck就跟一个Python自有的序列数据类型一样，可以体现出Python的核心语言特性（例如迭代和切片）

按照目前的设计，FrenchDeck是不能洗牌的，因为这摞牌是不可变的（immutable）：卡牌和它们的位置都是固定的，除非我们破坏这个类的封装性，直接对_cards进行操作。第11章会讲到，其实只需要下面一行代码来实现__setitem__方法，洗牌功能就不是问题了。这是因为可变的序列还必须提供__setitem__方法。

	def __setitem__(self, position, card):
		self._cards[position] = card

1.2 如何使用特殊方法

特殊方法的存在是为了被Python解释器调用的，你自己并不需要调用它们。也就是说没有my_object.__len__（　）这种写法，而应该使用len(my_object)。在执行len(my_object)的时候，如果my_object是一个自定义类的对象，那么Python会自己去调用其中由你实现的__len__方法。

然而如果是Python内置的类型，比如列表（list）、字符串（str）、字节序列（bytearray）等，那么CPython会抄个近路，__len__实际上会直接返回PyVarObject里的ob_size属性。PyVarObject是表示内存中长度可变的内置对象的C语言结构体。直接读取这个值比调用一个方法要快很多。

特殊方法的调用是隐式的，比如for i in x:这个语句，背后其实用的是iter(x)，而这个函数的背后则是x.__iter__（　）方法。当然前提是这个方法在x中被实现了。

通常你的代码无需直接使用特殊方法。除非有大量的元编程存在，直接调用特殊方法的频率应该远远低于你去实现它们的次数。唯一的例外可能是__init__方法，你的代码里可能经常会用到它，目的是在你自己的子类的__init__方法中调用超类的构造.

通过内置的函数（例如len、iter、str，等等）来使用特殊方法是最好的选择。这些内置函数不仅会调用特殊方法，通常还提供额外的好处，而且对于内置的类来说，它们的速度更快

Python内置的complex类可以用来表示二维向量，但我们这个自定义的类可以扩展到n维向量。

abs是一个内置函数，如果输入是整数或者浮点数，它返回的是输入值的绝对值；如果输入是复数（complex number），那么返回这个复数的模。

from math import hypot

class Vector: 
	def __init__(self, x=0, y=0): 
		self.x = x self.y = y 
	def __repr__(self): 
		return 'Vector(%r,%r)'%(self.x, self.y) 
	def __abs__(self): 
		return hypot(self.x, self.y) 
	def __bool__(self): 
		return bool(abs(self)) 
	def __add__(self, other): 
		x = self.x+other.x 
		y = self.y+other.y return Vector(x, y) 
	def __mul__(self, scalar): 
		return Vector(self.x * scalar, self.y * scalar)

1、Python有一个内置的函数叫repr，它能把一个对象用字符串的形式表达出来以便辨认，这就是"字符串表示形式"
repr函数就是通过__repr__这个特殊方法来得到一个对象的字符串表示形式的。如果没有实现__repr__，当我们在控制台里打印一个向量的实例时，得到的字符串可能会是 <Vector object at 0x10e100070>。
2、在老的使用%符号的字符串格式中，这个函数返回的结果用来代替%r所代表的对象；同样，str.format函数所用到的新式字符串格式化语法也是利用了repr，才把!r字段变成字符串。
3、Vector(1, 2)和Vector(‘1’, ‘2’)是不一样的，__repr__所返回的字符串应该准确、无歧义，并且尽可能表达出如何用代码创建出这个被打印的对象。

class A():
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return "A(%r, %r)" % (self.x, self.y)


a = A("3", 5)
print(a)  # A('3', 5)

4、__repr__和__str__的区别在于:后者是在str（　）函数被使用，或是在用print函数打印一个对象的时候才被调用的，并且它返回的字符串对终端用户更友好。

如果你只想实现这两个特殊方法中的一个，__repr__是更好的选择，因为如果一个对象没有__str__函数，而Python又需要调用它的时候，解释器会用__repr__作为替代。

中缀运算符的基本原则就是不改变操作对象，而是产出一个新的值。

上例只实现了数字做乘数、向量做被乘数的运算，乘法的交换律则被忽略了。在第13章里，我们将利用__rmul__解决这个问题。

为了判定一个值x为真还是为假，Python会调用bool(x)，这个函数只能返回True或者False。默认情况下，我们自己定义的类的实例总被认为是真的，除非这个类对__bool__或者__len__函数有自己的实现。bool(x)的背后是调用x.__bool__（　）的结果；如果不存在__bool__方法，那么bool(x)会尝试调用x.__len__（　）。若返回0，则bool会返回False；否则返回True。

如果想让Vector.__bool__更高效，可以采用这种实现：

def __bool__(self): 
	return bool(self.x or self.y)

因为or运算符可能会返回x或者y本身的值：若x的值等价于真，则or返回x的值；否则返回y的值。

1.3 为什么len不是普通方法

如果x是一个内置类型的实例，那么len(x)的速度会非常快。背后的原因是CPython会直接从一个C结构体里读取对象的长度，完全不会调用任何方法。获取一个集合中元素的数量是一个很常见的操作，在str、list、memoryview等类型上，这个操作必须高效。换句话说，len之所以不是一个普通方法，是为了让Python自带的数据结构可以走后门，abs也是同理。

__repr__和__str__的区别：前者方便我们调试和记录日志，后者则是给终端用户看的

程序小小白呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
01_python数据模型

数据模型：是对Python框架的描述，它规范了这门语言自身构建模块的接口，这些模块包括但不限于序列、迭代器、函数、类和上下文管理器。Python解释器碰到特殊的句法时，会使用特殊方法去激活一些基本的对象操作，这些特殊方法的名字以两个下划线开头，以两个下划线结尾（例如__getitem__）。比如obj[key]的背后就是__getitem__方法1.1 一摞Python风格的纸牌import...
复制链接

扫一扫

专栏目录