3月以来,“新基建” 成为热词,全国31个省份宣布未来投入“新基建”的投资总额已经超过40万亿!
这意味着,“新基建”所包含的七大领域:5G 基建、特高压、城际高速铁路和城际轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网,将迎来新的战略增长。
其中,人工智能在技术商业场景应用需求提升,产业规模将持续扩大。根据前瞻产业研究院预测,2020年我国人工智能市场规模增速45%,远超全球市场规模增速水平。
中央定调“新基建”,互联网大厂继续加码人工智能。然而,AI产业却面临着巨大的人才缺口!在这样的大环境下,如果你有志应聘相关的技术岗,只有苦练内功,趁早磨刀,比如认真刷题,才有可能在面试中致胜。
以下分享2个算法岗的经典面试题,选自《百面机器学习:算法工程师带你去面试》一书。
LDA (线性判别分析) 和 PCA 的区别与联系
首先将LDA 扩展到多类高维的情况,以和问题1 中PCA 的求解对应。假设有N 个类别,并需要最终将特征降维至d 维。因此,我们要找到一个d 维投影超平面,使得投影后的样本点满足LDA 的目标—最大化类间距离和最小化类内距离。
回顾两个散度矩阵, 类内散度矩阵在类别增加至N 时仍满足定义, 而之前两类问题的类间散度矩阵在类别增加后就无法按照原始定义。图4.6 是三类样本的分布情况,其中分别表示棕绿黄三类样本的中心,μ 表示这三个中心的均值(也即全部样本的中心),Swi 表示第i 类的类内散度。我们可以定义一个新的矩阵St,来表示全局整体的散度,称为全局散度矩阵
如果把全局散度定义为类内散度与类间散度之和,即St=Sb+Sw,那么类间散度矩阵可表示为
其中mj 是第j 个类别中的样本个数,N 是总的类别个数。从式(4.29&