- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 task3异常检测(线性模型)
主成分分析的实例 from pyod.models.pca import PCA from pyod.utils.data import generate_data from pyod.utils.data import evaluate_print from pyod.utils.example import visualize #生成样本数据 contamination = 0.1 #异常数据的比例 n_train =200 #训练数据 n_test = 100 #测试数据 X_train,..
2021-05-17 21:50:58
166
1
原创 异常检测task3(基于统计学的方法)
基于统计学的方法 掌握关于高斯分布的异常检测 一元高斯分布 高斯分布也称正态分布,我们可以利用已有的数据来预测总体中的和的计算方法如下: 概率密度函数为: 选定一个参数ε,将P(x)=ε作为我们的判定边界,当P(x)>ε时预测数据为正常数据,否则为异常。 多元高斯分布 构建协方差矩阵,使用所有特征来构建p(x) 首先我们先计算所有特征的平均值及协方差矩阵: 多元高斯分布的概率密度为 协方差? 通俗地讲, 协方差可以理解为:两个变量在变化过程中是同方向...
2021-05-14 22:09:50
70
原创 推荐系统科研入门
softmax是什么? 应用于多分类的问题中,将output的值映射到[0,1],且所有的output加起来等于1.其实可以理解 output(i)就是取i节点的概率,当然我们会选取概率最大的那个。 embedding是什么? 将一个对象用向量来表示出来,例如,将一个词语使用向量来表示它。 One-hot码是什么? 就是将类别的编码转为二进制类型,例如用户这个特征有A,B,C 现在将A,B,C转为特征变量,用0或1来表示其值。 ...
2021-05-11 22:32:56
54
原创 数据分析学习遇到问题的记录
pandas.DataFrame.resample 时间序列的df重构,可以参考如下文章 https://www.jianshu.com/p/8d3d612afbb2 matplotlib plt.legend() 给图加上图例 plt.subplot(2,3,1) 两行三列,1表示图形的标号
2021-05-11 20:25:39
56
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人