《机器学习实战》第5章Logistic回归,关于全批量梯度算法和随意梯度算法的比较 Transformer模型详解(对模型有些简化解释的嫌疑) Transformer全文翻译 Transformer代码实现即解释(哈佛大学)