机器学习
我是刘某某
机器学习小菜鸟一枚,加油加油加油
展开
-
为什么SVM最大化几何间隔等同于最小化||w||
这个问题困扰了笔者很久,今天终于弄明白了,记录一下,防止遗忘。 背景 SVM是一个二分类模型,目标是找到两个类别的最大间隔超平面。给定一组数据, 其中 公式推导 首先引入两个概念: 函数间隔:所有样本点到超平面wx+b=0的最小距离。由于几何间隔会随着超平面参数的变化而变化,如果w和b同时增大两倍,函数间隔也会增大两倍,这样的话不同超平面的函数间隔无法作比较; 几何间隔:将超平面的参数的模设为1 时的函数间隔,也就是超平面对应的函数间隔。 为了求最大间隔超平面,目标函数定义为: 由于不同原创 2021-01-07 16:50:17 · 1169 阅读 · 0 评论 -
python之nlp初体验
这周接到一个新的任务,目标是将疾病名称和对应的ICD10编码匹配起来。刚开始尝试直接将疾病名称对应的表和ICD10编码表根据疾病名称merge一下。但是我还是太天真了,不同医生记录习惯的不同,导致一种疾病可以对应n多个名称,所以就需要进行相似度匹配了。 这里需要用到两个库:jieba和gensim。jieba是一个可以用来中文分词的库,非常的成熟好用;gensim是一个自然语言处理的库,支持TF...原创 2020-03-23 21:34:00 · 276 阅读 · 0 评论