现在的AI专业(比如机器学习)已经沦为调包专业了吗?听听大神怎么说?
高赞回复一
作者:霍华德
链接:https://www.zhihu.com/question/327494084/answer/721135096
来源:知乎
我想你可能做了虚假的AI,虚假的AI有以下特点:
从不自己收集、处理、清洗、标注数据,而是找一个现有的数据集,疯狂 过拟合数据集。
科研idea主要来自于各种模块的花式排列组合,包含但不限于:各种CNN,各种RNN,各种attention,各种transformer,各种dropout,各种batchNorm,各种激活函数,各种loss function
而不是从实际问题和自然语言的现有挑战出发来思考idea
总是指望靠一个算法、一个模型可以解决所有问题
想做好真实AI,必须:
不断反馈,分析,改进。据说谷歌的搜索质量负责人Amit Singhal博士每天要看20个以上的不好搜索结果,然后持续不断的迭代改进。
面对真实环境中获取数据难,数据标注成本高,数据脏难清洗等问题
从实际问题和自然语言的现有挑战出发,设计针对问题最适合合理有效的模型
从不指望一个算法和问题可以解决所有问题,所有遇到的问题会做出合理的分析和拆解,针对各个难点设计最优解决算法,各个击破。
高赞回答二
作者:万盛中路摇滚乐队
来源:知乎
调参是 ML 这一领域不可避免的,但 ML 并不只是调参。学习 ML 这一方向,最重要的,个人认为是搞懂基本数学原理。尤其是在当前各种包极大丰富的情况下。就比如线性回归,你需要搞懂,数学公式当中,哪些部分是学习出来的,哪些部分是固定的,每一部分的“物理意义”是什么,一个公式里面,绝不会有无缘无故多出来的东西,每个东西都有其存在的意义。然后才是尝试去写代码,比如要实现一个线性回归,你会怎么实现(这个可以看现有包的源代码)。进而可以推广到其他的模型方法。你是做 NLP 的,那你应该至少会看 ACL / EMNLP / NAACL / COLING 的文章吧。找到自己感兴趣的文章,反复阅读。看文章的重点在于,
搞清楚文章要解决什么问题。
当前这个问题存在的现状是什么样的,为什么会存在,现有的解决方法是什么。
现有解决方法的不足是什么。
作者提出的解决方法是基于什么思想,这一步非常重要。
作者的模型是怎么做的。
从我的学习经历来看,这其中,5可能是最不重要的。而搞清楚 4 直接可以推出各种不同的5。我之前有实验室的哥们,分析了某一篇文章的4,然后在那篇文章的5上加了不到20行代码,效果提升了20%。
如果你对机器学习还是很有热情的,那你可以多专心思考一下机器学习当中一些脱离了编码的本质问题。多看论文,多写代码,写一些脱离了现有包的代码。这有助于你培养很好的问题分析 insight。
如果你对机器学习感到绝望,请像我一样,转方向吧。之所以感到绝望,是因为穷,买不起显卡。
高赞回答三
作者:Xenophon Tony
来源:知乎
计算机科学需要抽象需要站在巨人的肩膀上发展,这都不是无脑灌水的理由,灌水是讨巧的做法,是一种套利搬砖,很快当这个领域的迭代速度越来越快信息变得越来越有效,甚至出现真正成熟易用的automl的时候,这样的套利机会会消失,也就不存在所谓的调参搬砖了。我不是说调参不好,只是指出了一个大趋势,而这个大趋势适用于所有领域。只有当人们从繁复的体力劳动中解放出来,才能静下心来研究机器学习中更有趣的话题。如果你见过机器学习中更壮丽的风景,就一定会认同我说的话。
你的感觉没错,这个领域的平均技术门槛就是很低,而且在走生化环材的老路,听说某大佬因为idea太多没时间写代码,他导师给他专门招了一个RA帮他写代码,像不像伪化生实验室里的lab assistant?总有一天这些灌水的paper干不过搜出来的网络,这波人也就自动消失了。计算机的气就是经历了时间检验的系统,算法和理论。我们应不应该花大量的时间读那些最新的研究?应该,但更多地时候,它们不配。
高赞回复四
作者:纳米酱
来源:知乎
这问题暗含着调侃,无奈,以及心酸。
按道理来说,在计算机领域,调包是非常值得鼓励的行为,一来增加了代码复用率,减少重复造轮子,降低开发成本,使得人们能够快速使用第三方工具产生生产力,本质是技术的进步。
很可惜,重复造轮子的难度,以及成本都特别低的时候,达到人人都觉得自己能够造轮子的时候,该行为会变成恶俗。
当然,有些地方啃技术硬骨头,人家才不会开源呢,你想调包都调不了。
总结
调包是必须掌握的,但基础知识更重要,两者缺一不可。
不管今后AUTOML怎么发展,做个既懂基础,又会调包的人,这才是人才。
往期精彩回顾
适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am本站qq群1003271085。加入微信群请扫码进群: