![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 65
咚咚咚咚咚咚咚咚锵
这个作者很懒,什么都没留下…
展开
-
自动特征工程——特征编码Categorical Encoding
Backward Difference Coding反向差分编码用于编码类别变量的向后差对比编码。ce.BackwardDifferenceEncoder(verbose=0, cols=None, mapping=None, drop_invariant=False, return_df=True, handle_unknown='value',原创 2022-05-13 10:02:11 · 765 阅读 · 0 评论 -
自动特征构建工具——featuretools
简介featuretools是一个可以实现单表的转换操作和多表的跨表连接操作的框架。它擅长于将时间和关系数据集转换为机器学习的特征矩阵。特征工程常见的方法分为两种:1、针对单表的transform操作,例如log变换,特征编码等,都是在一张表上进行的;2、groupby聚合操作,一般是跨表进行的,比如groupby min max mean等等。官方文档参考博客知乎知乎多表操作定义实体集实体(entity,多个实体则称为实体集entityset)。实体就是一张表或者一个dataframe,原创 2022-05-11 16:04:21 · 1232 阅读 · 0 评论 -
聚类算法参数整理
原创 2022-01-04 17:04:04 · 1058 阅读 · 0 评论 -
r2adj——调整r方Adjusted R-Squared
import pandas as pdimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.linear_model import LinearRegressionimport statsmodels.api as smfrom scipy import statsimport matplotl...原创 2020-12-09 17:31:46 · 14880 阅读 · 1 评论 -
聚类:KMeans、DBSCAN、层次聚类AgglomerativeClustering及聚类评价指标
聚类(无监督学习)标题原创 2020-06-05 14:55:18 · 7898 阅读 · 2 评论 -
回归模型评价指标
预测值与实际值之间的误差(点对点)SSE和方差MSE均方差RMSE均方根MAE平均绝对误差预测值、实际值与实际值均值之间的误差(点对全)R方SSR(Sum of squares of the regression)预测值与实际值均值之差的平方和SST...原创 2020-02-25 12:02:17 · 882 阅读 · 0 评论 -
SIMCA的OPLS-DA相关
转自阿趣代谢微信公众号1. 去除离群值后新做的PCA分析还有很多样本离群,这种情况正常吗?正常,因为样本本身并不是独立的关系,存在组间差异和组内差异。2.OPLS-DA中score图t旁边的数字说是权重,是什么的权重?有什么含义?t[1]是针对预测主成分(横坐标)的回归系数权重大小;t[2]是针对正交主成分(纵坐标)的回归系数权重大小。3.做三组之间的OPLS-DA时,3D图有的数据拟合...原创 2020-02-25 12:00:26 · 37099 阅读 · 1 评论 -
OPLS-DA
转载转载 2020-02-14 10:55:20 · 8636 阅读 · 0 评论