机器学习
亚李士多德
静gaigai/jingjing_gai望住你
展开
-
机器学习笔记01特征工程
一.特征选择的方法1.过滤法选择特征1.1 方差筛选模型训练时,选择方差大的特征,舍弃方差小的特征。skleran.VaricandeThreshold通过指定方差的阈值,筛掉方差小于阈值的特征。1.2 相关系数分别计算训练集中各特征与输出值(输出连续值)的相关系数,通过设定阈值,选取相关系数较大的部分特征。1.3 假设检验a.卡方检验 b.F检验 c.t检验2. 嵌入法选择特征...原创 2019-06-05 11:17:49 · 175 阅读 · 0 评论 -
机器学习笔记02线性回归
# -*- coding: utf-8 -*-'''Folds5x2_pp.csv共有9568个样本数据,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。对应PE是样本输出,而AT/V/AP/RH这4个是样本特征, 机器学习的目的就是得到一个线性回归模型''''''不同方法建立线性回归模型一.传统的统计学statsmodels...原创 2019-06-06 02:24:07 · 773 阅读 · 1 评论 -
机器学习笔记03随机森林调参
# -*- coding: utf-8 -*-import osimport pandas as pdimport numpy as np# 读取数据os.chdir(r'F:\python_data_mining\train_modified')data = pd.read_csv('train_modified.csv')data = data.drop(['ID'], ax...原创 2019-06-11 01:19:55 · 261 阅读 · 0 评论 -
机器学习笔记04梯度提升树(GBDT)调参
# -*- coding: utf-8 -*-'''数据: train_modified''''''scikit-learn 梯度提升树(GBDT)算法类库GBDT分类类: GradientBoostingClassifier; GBDT回归类: GradientBoostingRegressorGBDT类库boosting框架参数(1)n_estimators(最大的弱学习...原创 2019-06-11 01:21:24 · 817 阅读 · 0 评论