全文共2053字,预计学习时长10分钟
在2019年苹果全球开发者大会上,新发布的Create ML应用程序为训练个人化机器学习模型提供了极其容易的方法。你唯一需要做的就是将含有训练数据的文件夹拖至Create ML程序内,而它会完成剩下繁重的任务。
那么应该如何准备数据呢?
当进行图像和音频分类的时候,只需要把数据整理到文件夹里。但如果要进行目标检测,事情会复杂一些。在目标检测时就需要对一些附加信息进行详细说明。
除了图像,还需要一个带有能表示目标位置的坐标的annotations.jso。这个注解需要和以下格式相匹配:
[
{
“image”: “image1.jpg”,
“annotations”: [
{
“label”: “carrots”,
“coordinates”: {
“x”: 120
“y”: 164
“width”: 230
“height”: 119
}
},
{
“label”: “orange”,
“coordinates”: {
“x”: 230
“y”: 321
“width”: 50
“height”: 50
}
}
]
},
…
]
注意:x坐标和y坐标是边框的中心并且所有坐标都以像素为单位。
怎样形成这种json格式呢?(当然不会手打了)
苹果公司称:
可以从网页上下载一些工具来建立这些【注解】。
那么应该用什么工具呢?云注解!
云注解正是为此而生的工具。它帮助人们在图像上快速画框并为人们提供苹果要求格式下的annotations.json。
创建目标储存实例
使用云注解需要创建目标储存实例。创建目标储存实例为储存训练数据提供了可靠之地。它也为数据的采集协作提供了可能性。它让人们能够收集用户数据并允许专家团队简单地标记数据。
IBM云提供了目标储存的简化层,其中包括了25GB的免费储存空间。
建立实例的第一步是登录或注册IBM云账号。
登陆后找到IBM云仪表盘,这里是创建和管理IBM云资源的地方。
为了创建新的云目标储存实例,点击创建资源按钮。
找到并选择云储存选项。
选择一个定价计划并点击创建,然后在弹出窗口中点击确认。
凭证
有了目标储存实例后就需要一个从IBM云外获取数据的渠道。因此需要为资源创建一系列的凭证。
换到服务凭证标签,点击新凭证按钮。
大多选项可以保留空白,但必须确保凭证中角色是作者并且添加了以下内敛配置参数:
{“HMAC”: true}
添加完后,点击浏览凭证,下拉菜单并记下apikey, access_key_id, secret_access_key and resource_instance_id.
{
“apikey”: “…”,
“cos_hmac_keys”: {
“access_key_id”: “…”,
“secret_access_key”: “…”
},
“endpoints”: “…”,
“iam_apikey_description”: “…”,
“iam_apikey_name”: “…”,
“iam_role_crn”: “…”,
“iam_serviceid_crn”: “…”,
“resource_instance_id**”: “…”
}**
云注解
找到云注解工具并添加目标储存凭证以使用工具。
文件和注解将被储存进名为桶的地方。点击创建桶按钮以创建新的桶。
创建并命名完桶之后,会出现选择另一注解类型的提示。选择定位给图像画框。
训练数据的最佳范例
· 将要训练的模型对现实中的目标相片进行优化。但对X射线、手绘图、扫描文件、收据等来说作用不大。
· 训练数据应当尽可能地接近那些要用于做预测的数据。例如,如果是使用模糊且分辨率低的图像(比如从监控摄像头提取出来的图像),训练数据就应当由模糊且分辨率低的图像构成。总的来说,也要考虑到为训练图像提供多倍角、一定的清晰度和相应背景。
· 将要训练的模型不能笼统地预测人无法分配的标签。因此,如果无法训练一个人在一两秒内通过看图分配标签,那或许也没法把模型训练成这样。
· 为了模型的可用性,建议每个标签至少添加50幅训练图像。不过成百上千的图像会有助于获得更好的结果。
· 将要训练的模型会把图像尺寸调整为300x300像素,因此在训练含有长度过于大于宽度的图像的模型时要留个心。
标记数据
标记图像需要:
-
上传视频或多张图像
-
创建想要的标签
-
开始绘制边框
获得注解
采集并标记了第一轮图像后,就可以准备开始训练模型了!
安装
安装云注解CLI以访问注解:
npm install -g cloud-annotations
注意:必须持有或随后安装Node 10.13.0。使用nvm(macOS/Linux)或nvm-windows就可以在不同项目间轻松转换Node版本。
下载注解
运行以下命令下载注解。
cacli export --create-ml
完成后会出现含桶的名为exported_buckets的文件夹。只需要将其拖至Create ML 应用程序中去就大功告成了!
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
添加小编微信:dxsxbb
即可进微信交流群