- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 极速制作证件照
点击【阅读原文】证件照用处较广,无论是四六级还是其它等级考试,我们都需要在报名时候上传一张符合要求的证件照。不会PS,怎么办?本文带您了解如何用Python程序处理证件照:修改证件照背景及尺寸。一、免费获取API密钥Step 1:注册用户https://accounts.kaleido.ai/users/sign_upStep 2:邮件激活账户Step 3:复制API密钥二、程...
2020-04-29 12:29:44 698
原创 【数据挖掘笔记】聚类评估
原文地址:【阅读原文】在之前的文章中已经介绍了四大类聚类方法及其典型的算法实现,那么,现在我们所需要做的就是聚类评估。聚类评估的主要任务包括:估计聚类趋势:简言之就是数据集上存在非随机结构,通俗地讲就是数据集不能是随机的,否则聚类则无意义。确定数据集中的簇数:这个好理解就是估计聚类数目K了,大多数聚类方法都需要提前制定簇数目K。测定聚类质量:对聚类结果进行评价。一、估计...
2020-04-27 11:29:01 1702
原创 【模型评估】通俗演义如何进行交叉检验
交叉验证(Cross validation,简称CV)是一种分类技术,别称旋转估计(Rotation estimation)或样本外测试(Out-of-sample testing)。假设我们已经建立了一个分类器,我们希望评估这个分类器的准确率,那么如何科学地评估分类器的准确率呢?在实验中,我们通常会采用k-折交叉验证技术来评估分类器的正确率。k-折交叉检验一般地,对于分类问题,我们需要两个数...
2020-04-26 16:09:40 438
原创 【数据挖掘】聚类分析实例
在之前,我们已经学过了四大类聚类分析及其典型算法。本文,我们将使用划分方法中的k-均值算法和层次聚类方法以一个实例进行完整的聚类分析演示。1. 问题描述例题: 为研究我国31个省、市、自治区2007年的城镇居民生活消费的规律,根据调查资料作区域消费类型划分。原始数据表1所示:问题:针对上述问题,采用k-means对其进行聚类(讨论k取何值才是最优);2. 采用层次聚类(讨论采用欧式距...
2020-04-26 12:36:24 16496 3
原创 【论文写作】论文实验结果图绘制细节
本殿下在此前一直使用MATLAB进行论文的绘图,不得不说,MATLAB绘图功能着实强大。但是,由于MATLAB程序比较大,所以,每次启动起来不是很方便。直到接触到Python中matplotlib模块,才发现Python中绘图其实也不赖。下面,本殿下将根据自己的经验就论文中绘图的一些细节进行总结。图中字体大小论文绘图是一门学问,好的实验结果图无疑会为论文增光添彩。我们看IEEE Trans系列...
2020-04-22 17:02:47 6078
原创 【算法推荐】层次聚类算法BIRCH及其实现
利用层次结构的平衡迭代归约和聚类(Balanced Iterative Reducing and Clustering usingHierarchies, BIRCH)是为大量数值数据聚类设计的,它将层次聚类(在初始微聚类阶段)与诸如迭代地划分这样的其他聚类算法(在其后的宏聚类阶段)集成在一起。它克服了凝聚聚类方法所面临的两个困难: (1)可伸缩性; (2)不能撤销先前步骤所做的工作。...
2020-04-17 15:17:39 3394 1
原创 【数据挖掘笔记】K-均值算法及其拓展
基于划分的聚类方法主要包括K-均值和K-中心点方法,本文为大家总结了K-均值算法及其拓展,连同程序一并献上。一、K-均值算法算法如下:例如:给定数据集合D,任取K = 2个对象作为初始聚类中心。计算各个对象到K个中心点的距离(如欧式距离),并将每个对象赋给最近的中心点。然后,更新簇的平均值, 即重新计算每个簇中对象的平均值作为簇的中心点。由于簇的中...
2020-04-08 11:02:00 922
原创 【数据挖掘笔记】度量数据的相似性和相异性
相信很多同学正在完成毕业论文(设计)或是准备投稿,今天就为大家推荐科研论文经常用到的数据处理内容——度量数据的相似性和相异性内容。能够用上这些内容,相信一定能为自己的论文增光添彩的!!!本文给出相似性和相异性度量。相似性和相异性都称邻近性(proximity)。相似性和相异性是有关联的。典型地,如果两个对象i和j不相似,则它们的相似性度量将返回0。相·似性值越高,对象之间...
2020-04-03 17:18:54 4333
原创 远见搜索CNKI论文爬虫
远见????,站得更高,看得更远!本程序是基于远见搜索的CNKI论文爬虫程序,下面介绍它的用处以及功能。一、远见搜索以“双支持向量机”为例,使用远见搜索检索得到如下结果:可以查看页面代码其页面代码简单,容易进行爬虫。二、程序代码基于远见搜索的CNKI爬虫代码如下:import osimport random...
2020-04-01 21:45:54 4344 2
论文潜搜 20191212 特别版.zip
2020-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人