先声明大部分都参照(https://zhuanlan.zhihu.com/p/22543073)
数学知识的复习
- 线性代数:(矩阵、特征值、特征向量、秩)
- 微积分:(极限、导数、拉格朗日中值、泰勒级数展开、傅里叶变换)
- 概率论:(https://blog.csdn.net/chybin500/article/details/78470705)需要的概率论知识
- 统计学基础:
- 相关性分析(相关系数r、皮尔逊相关系数、余弦相似度、互信息)
- 回归分析(线性回归、L1/L2正则、PCA/LDA降维)
- 聚类分析(KNN、K-Means)
- 分布(正态分布、t分布、密度函数)
- 指标(协方差、ROC曲线、AUC、变异系数、F1-Score)
- 显著性检验(t检验、z检验、卡方检验)
- A/B测试
算法和数据结构
- 枚举(8皇后问题)
- 递归(汉诺塔问题、树的前中后序遍历)
- 分治(求中位数、快排)
- 贪婪(Dijkstra 求最短路、Prim 最小生成树)
- 动态规划(背包问题、Floyd 求最短路)
- 链表(增删改查、循环链表、判环)
- 栈(用队列模拟栈、售货员卖棒冰找零问题)
- 队列(用栈模拟队列,双向队列、优先队列)
- 二叉树(BST、平衡树、线段树)
- 堆(最小/最大堆、堆排序)
- 排序(冒泡、选择、插入、快速、归并、堆、桶)
- 图论(DFS、BFS、最小生成树、最短路、关键路径、流网络)
- 字符串(KMP、字典树、AC自动机)
- 计算几何(线性规划、凸包)
机器学习基础
- 关联规则(Apriori、FP-Growth)
- 回归(Linear Regression、Logistics Regression)
- 决策树(ID3、C4.5、CART、GBDT、RandomForest)
- SVM(各种核函数)
- 推荐(User-CF、Item-CF)