sklearn
hlllllllll
这个作者很懒,什么都没留下…
展开
-
特征选择方法和sklearn中的特征选择应用
数据类型可用方法连续-连续相关系数、假设检验连续-离散相关系数、连续二值化(最小Gini切分、最大熵增益切分)连续-离散相关系数(定序)连续-离散相关系数,熵相关、F分值离散-离散(非二值)熵相关、Gini、相关系数(定序)...原创 2019-08-05 16:41:57 · 675 阅读 · 0 评论 -
sklearn 套索回归模型和参数选择
本算例主要验证套索回归中,分别采用AIC,BIC和交叉验证动态调整alpha的值,对结果的影响。采用AIC、BIC信息标准的模型选择通常十分迅速,但是依赖于对合适的自由度的评价,并且在大数据量的分析中,往往假定模型是正确的,然而基于数据产生的模型去描述事物通常不准确,存在实际特征大于样本的情况。对于交叉验证,分别采用20层的LassoCV算法和最小角回归算法路径进行计算,又称为并行下降算法,这...转载 2019-07-09 17:48:35 · 1461 阅读 · 0 评论 -
sklearn -回归分析的指标
sklearn.metrics.explained_variance_scoreexplained_variance_score(y_true, y_pred, sample_weight=None, multioutput=’uniform_average’)可释方差得分,表征数学模型中,残差的方差在整个数据集所占的比重的变量,计算公式如下:参数: y_true : 真实目标值的向...原创 2019-07-29 10:18:19 · 1406 阅读 · 0 评论 -
sklearn的特征分解
sklearn的特征分解主要有两个api模块,sklearn.decomposition和sklearn.cross_decompositiondecomposition主要是矩阵分解特征的算法:DictionaryLearning(n_components=None, alpha=1, max_iter=1000, tol=1e-08, fit_algorithm=’lars’, tra...原创 2019-07-24 14:38:28 · 539 阅读 · 0 评论 -
sklearn的特征抽取和特征筛选
数据分析过程中,往往需要处理很多类型的数据,数值型和非数值型,无论是在回归问题还是分类问题中,特征工程都是重中之重。我们都知道,特征值和特征向量在高等数学和线性代数中极为关键,特征工程,从表面上来说,就是从大大小小的数据中,筛选出有意义或者有用的条目,进而转换成一种数学表达,让机器和算法能够理解其中的意义。好比一个班上的每个学生,都有性别、年龄、身高、体重、成绩、性格特点等等特征,年龄、身高、体...原创 2019-07-23 15:36:23 · 4168 阅读 · 3 评论