核方法(kernel method)的主要思想

kernel method是针对低维线性不可分而提出的一种解决方法,在PRML中有一章节的介绍,对其理解,也是迭代更进的过程。 简单来说,kernel method是一种低维和高维特征空间映射的方法,利用低维内积的函数来表征高维内积,即高维的内积用低维内积的函数来表示,这个低维内积的函数就是ke...

2019-08-07 11:26:27

阅读数 5

评论数 0

如何将科技论文转化为精彩演讲? 科研人员必备能力!

如何将科技论文转化为精彩演讲? 很多中国学生在科技论文写作方面经过导师指点和长期训练后可以得到明显提升和改善.但是由于文化和环境限制,很多学生在学术演讲方面却缺乏足够的练习。 好的演讲技巧是一个成功科研人员必备能力之一。我们在学校和社会上将不断需要进行学术、工作和公众演讲。如果我们不能将自己的...

2019-08-05 16:53:37

阅读数 2

评论数 0

聚类的方法(层次聚类,K-means聚类)

所谓聚类,就是将相似的事物聚集在一 起,而将不相似的事物划分到不同的类别的过程,是数据分析之中十分重要的一种手段。比如古典生物学之中,人们通过物种的形貌特征将其分门别类,可以说就是 一种朴素的人工聚类。如此,我们就可以将世界上纷繁复杂的信息,简化为少数方便人们理解的类别,可以说是人类认知这个世界的...

2019-07-23 15:54:59

阅读数 4

评论数 0

样本选择的大致方法(小总结)

留出法 即按照一定比例留出测试样本,一般来说测试集与训练集互斥 交叉验证法 k折交叉验证 将样本划分为K等份,每次留一份作为测试,训练K个学习器,取测试结果的平均值 k折K次 在 k折交叉验证的基础上重复K次(每次都是随机划分)。相当于进行的k*k次训练和测试 自助法 通常用于样本规模较小时 从...

2019-07-08 13:21:50

阅读数 9

评论数 0

主动学习(Active Learning)

主动学习简介 在某些情况下,没有类标签的数据相当丰富而有类标签的数据相当稀少,并且人工对数据进行标记的成本又相当高昂。在这种情况下,我们可以让学习算法主动地提出要对哪些数据进行标注,之后我们要将这些数据送到专家那里让他们进行标注,再将这些数据加入到训练样本集中对算法进行训练。这一过程叫做主动学习...

2019-07-05 15:02:17

阅读数 5

评论数 0

Granular Computing(粒计算)

Granular Computing(粒计算) http://blog.csdn.net/chl033/article/details/4137964 (1).就国内外描述粒计算的三个词: Granularity 、Granule 和Granulation可以看出究竟什么是粒计算。 • “...

2019-05-09 15:45:45

阅读数 27

评论数 0

不平衡数据分类F-measure G-mean

类别数据不均衡是分类任务中一个典型的存在的问题。简而言之,即数据集中,每个类别下的样本数目相差很大。例如,在一个二分类问题中,共有100个样本(100行数据,每一行数据为一个样本的表征),其中80个样本属于class 1,其余的20个样本属于class 2,class 1:class2=80:20...

2019-04-19 20:23:40

阅读数 230

评论数 0

数据准确性和模型准确性

一、遇到了什么问题 昨天在看​文献,关于预测中国汽车保有量的。文献中提到了一个数据来源,就是国家统计局每年都会(现在已经暂停)调查不同收入等级(八个等级)收入、人口、汽车拥有量的情况。通过这些数据进行简单的计算就能得到不同收入等级群体的千人保有量情况。这个数据可以估算不同收入与千人保有量之...

2019-04-19 15:22:44

阅读数 67

评论数 0

keras解决多标签分类问题(附python代码)

multi-class classification problem: 多分类问题是相对于二分类问题(典型的0-1分类)来说的,意思是类别总数超过两个的分类问题,比如手写数字识别mnist的label总数有10个,每一个样本的标签在这10个中取一个。 multi-label classifica...

2019-04-01 16:48:10

阅读数 354

评论数 0

机器学习中的Bias(偏差),Error(误差),和Variance(方差)的区别和联系

机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系? 参见 https://www.zhihu.com/question/27068705  误差 在分类任务中,通常把错分的样本数占样本总数的比例称为错误率(error rate)。比如m个...

2019-03-24 15:20:43

阅读数 18

评论数 0

matlab 2018 64bit

1:解压matlab2018a 64bit 2:解压完后打开“setup.exe”,使用管理员权限,进入安装步骤   3:选择“使用文件安装密钥” 4:接受条款,下一步 5:复制密钥 09806-07443-53955-64350-21751-41297 6:默认路径或...

2018-10-19 13:15:39

阅读数 321

评论数 0

Manage your TeX installation with MiKTeX Consol

MiKTeX Console is the tool you use to manage your TeX installation. Most often you will use it to get package updates.Start MiKTeX ConsoleMiKTeX Cons...

2018-07-04 22:20:35

阅读数 135

评论数 0

Python3.5 下载安装教程并安装numpy模块

使用到的资源:numpy python3.5 for win7 64bitpython3安装教程 第一步:在路径下下载python3的可执行文件 下载来了安装第一步就是双击下载下的安装文件安装python3.5.4版本的python,记得勾选最下面的将Python路径加入到PATH中,如果你没有勾...

2018-04-18 20:17:38

阅读数 1768

评论数 0

2018 最新注册码【激活码】、在线激活 pycharm 完整方法(亲测有效)

win10系统下第一种有效,第二种现在不可以用了。原来方法的第二种还是有效的,操作如下(1)更新hosts文件host文件地址:https://pan.baidu.com/s/1o9ZujxShosts文件,在windows中的地址为:C:\Windows\System32\drivers\etc...

2018-04-14 14:56:48

阅读数 2632

评论数 0

win10系统pyCharm安装及最新2018激活码

pycharm下载,win10系统也可以使用384https://www.jetbrains.com/3844针对激活码的话,步骤很简单, 亲测可用,比其他的好用多了:打开安装好的软件选择Activate new license with License server在License sever ...

2018-04-14 13:54:53

阅读数 2802

评论数 2

提示
确定要删除当前文章?
取消 删除