![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
py
文章平均质量分 57
YnagShanwen
这个作者很懒,什么都没留下…
展开
-
特征工程
数据预处理 Preprocessing & Impute菜菜第3章1. 无量纲化??需要无量纲化的情况原始数据不同维度的尺度(量纲)不一致时,need在分类、聚类算法中,需要使用距离来度量相似性时,或使用PCA降维时,标准化(standardization,也叫Z-score)表现更好(数据均值为0,方差为1),实际上不改变分布!!!在希望压缩数据,却不影响数据的稀疏性时(不影响矩阵中取值为0的个数时),我们会使用***MaxAbsScaler***!!!这个评述对选标准化还是归一化原创 2021-05-14 18:43:50 · 665 阅读 · 0 评论 -
Python中使用extend方法和‘+‘方式拼接list选择
extend会使两个空列表合并后消失,并不是list。这个在跑大型程序时容易出错。例如循环时out of rangelist相对较长时,+ 耗时更长,因为是在循环做加法.原创 2021-05-12 19:32:30 · 212 阅读 · 0 评论