1. 梯度下降
a.原理:
通过学习率与学习方向来调整回归系数
b.api:
from sklearn.linear_model import SGDRegressor
fit
predict
c.损失
api:
from sklearn.metrics import mean_squared_error
2. 决策树算法
a. 原理:
古典的if else 条件结构
b. 信息熵:
信息的作用: 减少不确定性
c. 信息增益
g(D,A) = H(D) - H(D\A)
d.api:
位置: from sklearn.tree import DecisionTreeClassifier
估计器对应方法:
fit
predict
score
3. 字典类的特征抽取
a. 原理:
将数据中的字符串配合key 组成新的特征
b. api:
转换器
from sklearn.feature_extraction import DictVectorizer
fit
transform
fit_transform
4. 特征降维
a.定义:
高维数据向低维数据转换的过程: 得到一组不相关的数据
b.包含内容:
i. 特征选择
1).去除掉方法低的 特征, 不会改变原有特征的值
ii.主成分分析
1).在特征降维的过程中会产生新的特征值
api: from sklearn.decomposition import PCA
5. kmeans 算法
a.算法步骤
i. 随机选取要聚的类别个点
ii. 对所有数据通过距离进行同化
iii. 在同化的范围内 选取中心点 重复第二部,直到上一次选择的中心点与
这一次选择的中心点相同
b. api:
from sklearn.cluster import KMeans
6. 环境安装 tensorflow
pip install tensorflow