机器学习
文章平均质量分 88
Fryant24
Why not?
展开
-
机器学习模型不能部署的几大原因
模型部署失败的“史诗”级案例发生在Netflix主办的一个数据分析比赛中。参赛者需要使用协同过滤算法来预测用户对电影的评分,优胜者可以获得100万美元的大奖,可悲的是,直到比赛结束都没有一个模型完成部署。不仅仅是Netflix,大多数公司都会遇到这样的问题,一半的预测模型都没有成功部署。没有人想建立一个不能在现实世界中使用的模型,这就像是烤了一个美味的蛋糕,你自己尝了也觉得很不错,但却永远都不能...翻译 2018-11-06 16:01:09 · 914 阅读 · 0 评论 -
机器学习:评判模型的几个指标——PR,ROC,F-easure
小明是AI小学的一个小学生,在他的班里有男生80人,女生20人,共计100人。第一天上学,小明被要求通过自身观察,找出所有的女生来。 现在,小明挑选出了50个人,其中20人是女生,另外还错误地把30个男生也当作女生挑选了出来了。 作为评估者的你需要来评估下他的工作,用一些不同的标准来衡量他这次划分的准确度。精确率与召回率 首先登场的是两个最直观的比率,精确率和召回率(Prec...原创 2018-11-06 16:23:01 · 1214 阅读 · 0 评论 -
图的向量化表示概述
图的向量化表示,意即通过多维向量空间中的一点来表示一个图的特征,方便使用机器学习的方法对其进行分类操作。 首先讨论怎么从一副普通的图像中提取出特征图: 原图是(a),然后对其做碎片化,得到图(b),对原图做二值化得到图(c),图(b)和图(c)叠合得到图(d)。对于图(d)做下列定义: 各个色块被定义为特征图的各个节点,节点编号集合是颜色集合{黑,蓝,棕,绿,灰,橙,粉,紫,红,白...原创 2019-01-23 15:23:37 · 5545 阅读 · 0 评论 -
字符粘连切分方法
目的本方法目的在于解决英文字母OCR中存在的字符粘连问题,使得算法的运算结果更为准确。化学式中存在的粘连问题主要有以下几个特点:一是字符种类较少,大都由常见化学元素的组合和基本的数字构成;二是字符的宽度基本一致,一般不存在一大一小的情况,这方便了我们使用字符宽度这一定界条件而又不影响切分的准确性;最后一个是字符的走向大都是水平方向,因此我们在切割时只需要考虑竖直向的切割即可。解决对象...原创 2019-01-23 15:45:57 · 5246 阅读 · 1 评论