- 博客(6)
- 收藏
- 关注
原创 字符粘连切分方法
目的本方法目的在于解决英文字母OCR中存在的字符粘连问题,使得算法的运算结果更为准确。化学式中存在的粘连问题主要有以下几个特点:一是字符种类较少,大都由常见化学元素的组合和基本的数字构成;二是字符的宽度基本一致,一般不存在一大一小的情况,这方便了我们使用字符宽度这一定界条件而又不影响切分的准确性;最后一个是字符的走向大都是水平方向,因此我们在切割时只需要考虑竖直向的切割即可。解决对象...
2019-01-23 15:45:57 5246 1
原创 图的向量化表示概述
图的向量化表示,意即通过多维向量空间中的一点来表示一个图的特征,方便使用机器学习的方法对其进行分类操作。 首先讨论怎么从一副普通的图像中提取出特征图: 原图是(a),然后对其做碎片化,得到图(b),对原图做二值化得到图(c),图(b)和图(c)叠合得到图(d)。对于图(d)做下列定义: 各个色块被定义为特征图的各个节点,节点编号集合是颜色集合{黑,蓝,棕,绿,灰,橙,粉,紫,红,白...
2019-01-23 15:23:37 5544
原创 单链表结构的一元多项式c++实现
最近在复习数据结构,发现一元多项式的表示和运算很适合用单链表来实现,因此写了一个c++类,代码贴上来与大家分享。#include <iostream>using namespace std;struct polynode{ float xi; int zhi; polynode *next;};//一元多项式类class polynomial{public: po...
2018-11-20 16:36:18 1198
原创 机器学习:评判模型的几个指标——PR,ROC,F-easure
小明是AI小学的一个小学生,在他的班里有男生80人,女生20人,共计100人。第一天上学,小明被要求通过自身观察,找出所有的女生来。 现在,小明挑选出了50个人,其中20人是女生,另外还错误地把30个男生也当作女生挑选了出来了。 作为评估者的你需要来评估下他的工作,用一些不同的标准来衡量他这次划分的准确度。精确率与召回率 首先登场的是两个最直观的比率,精确率和召回率(Prec...
2018-11-06 16:23:01 1214
翻译 机器学习模型不能部署的几大原因
模型部署失败的“史诗”级案例发生在Netflix主办的一个数据分析比赛中。参赛者需要使用协同过滤算法来预测用户对电影的评分,优胜者可以获得100万美元的大奖,可悲的是,直到比赛结束都没有一个模型完成部署。不仅仅是Netflix,大多数公司都会遇到这样的问题,一半的预测模型都没有成功部署。没有人想建立一个不能在现实世界中使用的模型,这就像是烤了一个美味的蛋糕,你自己尝了也觉得很不错,但却永远都不能...
2018-11-06 16:01:09 914
原创 在标准linux系统上编译运行cobalt浏览器
在标准linux系统上编译运行cobalt浏览器描述基本步骤完成效果描述这篇文档详细介绍了在标准linux环境(ubuntu 16.04 LTS)下怎么编译运行cobalt浏览器的源码基本步骤获取depot toolsgit clone https://chromium.googlesource.com/chromium/tools/depot_tools.git获取depot_t...
2018-10-26 10:55:38 1562 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人