![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
杂七杂八
wqjsmile
这个作者很懒,什么都没留下…
展开
-
Maven 报错:Cannot resolve plugin org.apache.maven.plugins:maven-resources-plugin:2.6
新建maven项目导入包时,报错Cannot resolve plugin org.apache.maven.plugins:maven-resources-plugin:2.6只需在pom.xml中添加如下:<dependency> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-resources-plugin</arti原创 2021-07-09 13:10:26 · 5895 阅读 · 0 评论 -
Apriori算法
Apriori算法 Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据集,那么对于超市,我们可以优化产品的位置摆放,对于电商,我们可以优化商品所在的仓库位置,达到节约成本,增加经济效益的目的。(1) 频繁项集的评估标准 什么样的数据才是频繁...转载 2020-04-07 17:18:08 · 339 阅读 · 0 评论 -
《python数据挖掘入门与实践》第4章代码(亲测有效)
import osimport pandas as pddata_folder = os.path.join("ml-100k")ratings_filename = os.path.join(data_folder, "u.data")all_ratings = pd.read_csv(ratings_filename, delimiter="\t", ...原创 2020-04-08 22:50:15 · 447 阅读 · 2 评论 -
EndnoteX9最详细,最认真,最用心的教程
最近在学习Endnote这一款软件,了解之后才发现这款软件在文献管理方面的高效性,后来为了学习endnote的功能,我找了好多入门教程,但是都不是很满意,后来,我还真的找到了一个目前为止我认为是最详细、最认真的教程,为了让更多需要endnote的人能更快的入门,我把这套资源分享给大家~~链接为:https://zhuanlan.zhihu.com/p/49804810名字:《手把手教你使用EndNote X9》Github: https://github.com/wanzhenchn/EndNote_转载 2020-05-26 09:36:04 · 4960 阅读 · 0 评论 -
Python中的Matplotlib用法
Matplotlib是Python的绘图库,不仅具备强大的绘图功能,还能够在很多平台上使用,所以掌握用它画图的技能很有必要。Matplotlib的安装我们可以通过Anaconda中的命或者“pip install matplotlib"语句来安装Matplotlib,在安装完成后通过运行import matplotlib语句,来检验安装是否成功。如果没有输出报错,则说明安装没有问题,可以正常使用。在实际应用中,我们同样习惯于将“import matplotlib写成“ import matplotl原创 2020-06-01 21:31:15 · 1208 阅读 · 0 评论 -
Aurora应用到word中
word虽然应用非常广泛,但是他对于数学公式来说非常不友好,编写出来的公式排版非常不工整,于是就有了latex优美的排版,但是如何把latex应用到word中呢,我查到一个word插件,叫Aurora,这个插件可以在word里插入公式,但是在安装这个插件的过程中遇到了诸多问题,查来查去,最后是找到的一篇链接解决了我的问题:http://www.yuerya.me/post/aurora-%7C-latex-in-word...转载 2020-06-20 12:01:45 · 588 阅读 · 0 评论 -
聚类算法——DBSCAN概要
DBSCAN是一种基于密度的聚类算法,直观效果上看,DBSCAN算法可以找到样本点的全部密集区域,并把这些密集区域当做一个一个聚类簇。DBSCAN算法首先将样本点分类为:(1)稠密区域内部的点(核心点,领域半径EPS内样本点的数量大于等于minpoints的点),(2)稠密区域边缘上的点(边界点,不属于核心点但在某个核心点的邻域内的点),(3)稀疏区域的点(噪声或背景点)。样本点的关系有四种:密度直达、密度可达、密度相连、非密度相连。如果P为核心点,Q在P的R邻域内,那么称P到Q密度直达原创 2020-08-01 11:20:23 · 605 阅读 · 0 评论 -
不平衡数据处理方法总结(学习笔记)
本文资料收集于互联网,内容大部分为转载+汇总,主要是针对不平衡数据的处理进行一个总结,以便日后翻阅。常用的分类算法一般假设不同类的比例是均衡的,但是现实生活中经常遇到不平衡的数据集,比如广告点击预测(点击转化率一般都很小)、商品推荐(推荐的商品被购买的比例很低)、信用卡欺诈检测等等。对于不平衡数据集,一般的分类算法都倾向于将样本划分到多数类,体现在模型整体的准确率很高,但是对于极不均衡的分类问题,比如1%-99%的比例,模型会将所有样本都分到99%的类里,这样的模型是没有用的,于是在类不平衡情况下, 一般原创 2020-08-27 11:19:29 · 3272 阅读 · 0 评论 -
ROC曲线的阈值确定与平衡点确定
ROC曲线实际上是多个混淆矩阵的结果组合,以疾病检测为例,这是一个有监督的二分类模型,模型对每个样本的预测结果为一个概率值,我们需要从中选取一个阈值来判断健康与否。定义好一个阈值之后,超过此阈值定义为不健康,低于此阈值定义为健康,就可以得出混淆矩阵。而如果在上述模型中没有定义好阈值,而是将模型预测结果从高到低排序(排不排序都一样,因为我们需要用作作图的TPR和FPR都是根据这些概率值计算出来的,现在不排序,等据图画图的时候也得排序),将每次概率值依次作为阈值,那么就可以得到多个混淆矩阵。对于每个混淆矩阵,我原创 2020-08-28 09:59:00 · 16705 阅读 · 1 评论 -
Pytorch 多GPU训练指北
最近训练模型时常常遇到"cuda out of memory"的问题,后来尝试了一些多GPU并行训练的方法,但是结果是多GPU训练的效果并不如多GPU训练的效果,碰巧看到了一篇文章,对于多GPU训练的代码写法进行了不错的总结,记录一下:博客链接:https://oldpan.me/archives/pytorch-to-use-multiple-gpus...转载 2020-12-01 13:56:56 · 107 阅读 · 0 评论