- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 task3异常检测(线性模型)
主成分分析的实例from pyod.models.pca import PCAfrom pyod.utils.data import generate_datafrom pyod.utils.data import evaluate_printfrom pyod.utils.example import visualize#生成样本数据contamination = 0.1 #异常数据的比例n_train =200 #训练数据n_test = 100 #测试数据X_train,..
2021-05-17 21:50:58 172 1
原创 异常检测task3(基于统计学的方法)
基于统计学的方法掌握关于高斯分布的异常检测一元高斯分布高斯分布也称正态分布,我们可以利用已有的数据来预测总体中的和的计算方法如下:概率密度函数为:选定一个参数ε,将P(x)=ε作为我们的判定边界,当P(x)>ε时预测数据为正常数据,否则为异常。多元高斯分布构建协方差矩阵,使用所有特征来构建p(x)首先我们先计算所有特征的平均值及协方差矩阵:多元高斯分布的概率密度为协方差?通俗地讲, 协方差可以理解为:两个变量在变化过程中是同方向...
2021-05-14 22:09:50 73
原创 推荐系统科研入门
softmax是什么?应用于多分类的问题中,将output的值映射到[0,1],且所有的output加起来等于1.其实可以理解 output(i)就是取i节点的概率,当然我们会选取概率最大的那个。embedding是什么?将一个对象用向量来表示出来,例如,将一个词语使用向量来表示它。One-hot码是什么?就是将类别的编码转为二进制类型,例如用户这个特征有A,B,C 现在将A,B,C转为特征变量,用0或1来表示其值。...
2021-05-11 22:32:56 56
原创 数据分析学习遇到问题的记录
pandas.DataFrame.resample时间序列的df重构,可以参考如下文章 https://www.jianshu.com/p/8d3d612afbb2matplotlibplt.legend() 给图加上图例plt.subplot(2,3,1) 两行三列,1表示图形的标号
2021-05-11 20:25:39 58
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人