![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 85
韩jinxu
这个作者很懒,什么都没留下…
展开
-
数据分析/论文作者统计
任务说明¶ 任务主题:论文作者统计,统计所有论文作者出现评率Top10的姓名; 任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作; 任务成果:学习 Pandas 的字符串操作; 数据处理步骤 在原始arxiv数据集中论文作者authors字段是一个字符串格式,其中每个作者使用逗号进行分隔分,所以我们我们首先需要完成以下步骤: 使用逗号对作者进行切分; 剔除单个作者中非常规的字符; 具体操作可以参考以下例子: C. Bal\'azs, E. L. Berger, P. M. Nadols原创 2021-01-16 00:36:43 · 341 阅读 · 0 评论 -
异常检测/基于统计学的方法
1、概述 统计学方法对数据的正常性做出假定。**它们假定正常的数据对象由一个统计模型产生,而不遵守该模型的数据是异常点。**统计学方法的有效性高度依赖于对给定数据所做的统计模型假定是否成立。 异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。 即利用统计学方法建立一个模型,然后考虑对象有多大可能符合该模型。 根据如何指定和学习模型,异常检测的统计学方法可以划分为两个主要类型:参数方法和非参数方法。 参数方法假定正常的数据对象被一个以Θ\T原创 2021-01-16 00:32:14 · 225 阅读 · 0 评论