- 博客(4)
- 资源 (4)
- 收藏
- 关注
转载 通俗理解PCA降维作用
http://doc.okbase.net/u013719780/archive/239009.html注意:有些资料不能复制。用PCA降维本章我们将介绍一种降维方法,PCA(Principal Component Analysis,主成分分析)。降维致力于解决三类问题。第一,降维可以缓解维度灾难问题。第二,降维可以在压缩数据的同时让信息损失最小化。第三,理解几百个维度的数据结构很困难,两三个维度...
2018-03-29 20:38:48
13304
2
转载 特征值和特征向量
6031在刚开始学的特征值和特征向量的时候只是知道了定义和式子,并没有理解其内在的含义和应用,这段时间整理了相关的内容,跟大家分享一下;首先我们先把特征值和特征向量的定义复习一下:定义: 设A是n阶矩阵,如果数λ和n维非零向量x使关系式……(1)成立,那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量,(1)式还可以写为: ……(2)如果想求...
2018-03-27 20:19:25
478
原创 TA_EVENR_TNT导入ods 问题处理
1. 时间: 201803162. 现象:这个现象已经一个多月了,每天导入都是卡死,执行到select 后没有反应,好像没有连接上,开始map 设置为1时,没有错误,当调整5和10 时,只有一个map 失败2次,出现错误,并且失败任务重试3次,前2次失败,出现错误,第三次到执行select 时一直挂起,也不失败。4. 处理:TMS.TA_EVENR_TNT 数据大概2...
2018-03-23 13:57:53
280
转载 Hdfs的数据磁盘大小不均衡如何处理
原创 2018-03-13 浪尖 Spark学习技巧最近浪尖在纠结一个现在看起来很简单的问题。现象描述建集群的时候,datanode的节点数据磁盘总共是四块磁盘做矩阵成了一个7.2TB的sdb1(data1),两块通过矩阵做了一个3.6TB的sdc1(data2)磁盘,运维做的,历史原因。刚开始没有发现,然后集群过了一段时间,随着数据量的增加,发现集群有很多磁盘超过使用率90%告警,浪尖设置磁盘告...
2018-03-13 19:39:55
2152
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人