Transformers这种深度学习架构,为人工智能的发展做出了杰出贡献。它在人工智能和整个技术领域都是一个重要的里程碑,但它也有一些复杂之处。目前已经有了很多关于Transformers的好资源了,为什么我还要再创作这个系列呢?原因有二:
我深谙自学之道,而且根据我的经验,阅读不同的人如何描述相同的观点,能够大大加深我们对这些知识的理解。
目前,我很少在阅读一篇文章时,认为这篇文章的解释已经足够简单。技术内容创作者往往总是将概念过度复杂化或没有充分的去解释。我们应该明白,没有什么是rocket science,甚至连rocket science都不是。只要对其的解释足够好,我们可以理解任何东西。 在本系列中,我将尝试对Transformers做出足够好的解释。
此外,作为一个凭借博客文章和开源代码走上职业道路的人,我认为我有义务回报社会。
该系列将尝试为那些几乎不了解人工智能的人和那些了解机器学习原理的人,都提供合理的指导。我打算怎么实现这一目标呢?首要的是要合理去解释Transformers。在我的职业生涯中,我阅读了近1000篇技术文章(就像这篇文章一样),我阅读时所面临的主要问题是作者(或许是潜意识地)假设你已经了解了很多相关的知识。在本系列中,我打算假设你阅读过的相关技术文章,比我为创作这篇文章而阅读的Transformers文章数量还要少。<