自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 做了一个标注工具原型版本【转自 彭瀚 的脉脉专栏】

RT前段时间有个基于labelme的标注工具功能开发需求,总结了一个文档,为了展示给领导和供应商,自己也简单做了个工具原型(粗坯)。需求总结:标注模块需实现功能:(1).缩/放图片后的自由拖动(以当前鼠标点为中心)(2).位置定标十字线(横纵顶到头)(3).图片中的label和list中的label可以通过点击相互定位,方便检查修改等操作(4).渲染色填充框,方便识别对比度低下的label轮廓(5).自动贴点/贴边(通过按键切换)(6).当前图片...

2020-10-27 14:07:14 485

转载 小结数据标注初创公司低成本预算运营思路【转自 彭瀚 的脉脉专栏】

起因:前段时间跟天津滨海新区的一家AI创业公司聊了聊,期间也给对方拟了一份简要的关于低成本低预算情况下实现较高质量、较大批量AI训练数据交付(内/外)的运营思路。经常去思考相关问题确实能帮助对业务的理解和行业的认知不断优化、加深。我在此记录下来,若参考此内容能或多或少帮到一些人,那也是极好的。基本思路:通过 招人(数量、成本、质量);激励(绩效、补贴);优化(流程、工具);算法 等维度 分析帮助创业公司实现较低成本预算下产出足以内外交付的优质大批量数据的一般方案。一、节约成本招人:坐班人数

2020-08-11 15:27:40 869 1

转载 深度从业者看2020 AI数据训练 产业趋势【转自 彭瀚 的脉脉专栏】

原贴【https://maimai.cn/article/detail?fid=1380657661&efid=FwoWujrZKZVfUFYdYLgmfg】本文系我近年间的AI训练从业经验,来聊聊接下来一年AI数据产业的短中期趋势。我自2016年底开始在一家AI创业公司从事名为“AI训练员”的职位,7个月后成为产品工程组长,着手“针对产品实现可能性的AI模型训练需求”——【规划】,...

2020-04-10 15:51:58 810

转载 在/离线数据标注孰强孰弱?【转自 彭瀚 的脉脉专栏】

我刚接触AI训练那段时间,是在一家创业公司。因为财力人力的缺陷,往往一个人就需要承担从数据规划到采集到清洗到标注甚至最后跑图调阈测试(验证集测试)的所有步骤。多年后回忆起那段动辄996.5的时光,更多的还是对公司培养的感激以及对更合理安排工作时间的企业的追寻[笑]。那时每个项目大概的工作流程是:我们训练员依据公司主要产品的所涉领域,以及相应用户画像,琢磨出训练所需数据的来源;接着判断这批数据是...

2019-06-07 12:00:15 219

转载 影响数据标注效率的表、里因素【转自 彭瀚 的脉脉专栏】

受益于本人两年多来曾从事过的3个全职AI数据处理工作以及至今20+个不同方向的AI数据兼职项目,让我在较短的时间内执行并掌握了人工智能训练数据集的 规划、采集、清洗、标注和建模 这一整套流程(主要是 有监督学习)。因此自认为或许可以在对AI数据处理的效率问题上bb几句:)ok闲话不多说——表因素———工具:一个贴合本公司数据业务要求的工具一定是比开源的通用工具要更具使用效率的。由于企业间...

2019-06-02 17:42:43 571

转载 数据标注行业前景与发展方向浅析【转自 彭瀚 的脉脉专栏】

前段时间领英上一个SEU的M.A.小老弟跟我咨询数据标注平台创业前景和渠道切入点等一系列问题。我们聊了许多,其中非常有意思的是他对标注的描述——“数据标注不就是拉框啥的吗”。我哭笑不得吧,也有点无奈。毕竟单就标注行业/职位的现状,"拉框啥的"还真就是一个简洁明了又直指业务核心的称谓。可以说,哪怕到了19年,10000个人里恐怕有9900个都不知道"数据标注"是干啥的。而剩下有99.5个对数据标...

2019-06-02 17:39:25 12766 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除