早就听说流形正则化能将有监督学习和无监督学习融合成半监督学习,听上去威武霸气,但真正一看就只能高山仰止了。今天硬着头皮学习了一下,浅浅品味往圣先哲的思维魅力。
半监督学习(semi-supervise learning)初一听觉得很迷惑,什么是半监督学习?为什么要半监督学习?平时我们做机器学习的时候,大多数都是人为给定label的有监督学习,大家也都很向往人们毫不费力的无监督学习。但细细一想,这两类情况都有点先天缺陷的感觉,有监督学习虽然精度较高,但是人们得手工标注,太累,离人们理想中的“智能”太远;无监督学习虽然很轻松,计算机自动的就把所有工作一步到位了,但是往往精度低于人们的预期。于是乎,大牛们又开始进行哲学的思考了,如果一个婴儿(暂且把我们可爱的不懂事的计算机当成小宝宝吧)要学习一个东西,他会怎么学呢?终于有一天,善于思考的大家们发现,小婴儿会根据自己的好奇心观察探索一个东西很久,期间会有人告诉他这是什么,然后聪明的宝宝从此就学认识了这个东西。于是乎,半监督学习就应运而生了,用大量的无标签样本结合部分有标签样本进行训练。细细想来,生活中大多数情况都是如此。自从有了半监督学习,研究机器学习的人们从此进入了崭新的时代,既可以偷懒,又可以达到理想的效果。