![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI
文章平均质量分 86
源码头
稀有源码资源提供者
展开
-
AI技术内参141-数据科学家团队组织架构:水平还是垂直,这是个问题
周一我们聊了数据科学家培养的话题,我们分析了数据科学家培养的重要性,要从技术的提高和整体的团队协作几个角度来进行培养。今天我们来讨论数据科学家团队高级话题中的最后一个,也是非常现实的一个问题,那就是对于一个组织来说,究竟应该形成怎样的组织架构呢?是选择一个集中式的数据科学家团队或者叫?还是成立一个分散式的、每个产品部门都有数据科学家的呢?对于很多公司或组织来说,在构建一个数据科学家团队的时候都会遇到这个棘手的问题。原创 2023-05-03 20:36:55 · 171 阅读 · 0 评论 -
AI技术内参140-人工智能领域知识体系更新周期只有5~6年,数据科学家如何培养?
在上一期的分享里,我们聊了数据科学家团队管理的一个重要步骤,那就是如何来衡量数据科学家或者人工智能工程师在团队中的业绩,我们重点讲了如何看待数据科学家团队的价值和数据科学家评定的一些误区。今天,我们来聊另一个数据科学家团队的高级话题,那就是数据科学家的培养的问题。原创 2023-05-03 20:35:49 · 156 阅读 · 0 评论 -
AI技术内参139-成为“香饽饽”的数据科学家,如何衡量他们的工作呢?
本周我们聊了在构建一个数据科学家团队时,从筛选简历入手到电话面试,再到Onsite面试这一系列的流程。从无到有,建立一个数据科学家或者人工智能团队的确是一件煞费苦心的事情。那么今天,我们来聊一聊数据科学家团队管理的下一个重要的步骤,那就是绩效评定的种种规则必须在团队建立的初期就明确,否则就会出现一些不定因素,对于招聘、培训以及留住人才都有着不可估量的影响。原创 2023-05-03 20:35:07 · 63 阅读 · 0 评论 -
AI技术内参138-数据科学团队养成:Onsite面试面面观
本周我们来聊数据科学或者人工智能团队的招聘话题。周一的分享里,我们聊了聊组建数据科学家团队所必不可少的两个步骤,筛选简历和电话面试。我们着重从招聘博士毕业生的角度对这两个环节进行了剖析,梳理了如何看简历,以及在电话面试时需要考察哪些内容。今天,我们来聊一聊电话面试后面的一个环节,也就是邀请候选人到公司面试,俗称Onsite面试。原创 2023-05-03 20:34:39 · 133 阅读 · 0 评论 -
AI技术内参137-数据科学团队养成:电话面试指南
眼下,数据科学或者人工智能团队已经成了很多数据驱动公司的标准配置团队,数据科学家或者人工智能工程师也成为了最“性感”的职业。不少公司都在想办法建立或者扩展自己的数据科学团队。那么,对于一个公司来说,究竟需要什么样的数据科学团队呢?这就成了很多公司在发展过程中都会遇到的棘手的问题。我们在之前的一篇分享里已经剖析过,作为一个工程团队的负责人,你该如何招聘自己的数据科学家团队。在那篇分享里,我们探讨了目前人才市场上大致有两类数据科学家,一类偏数据分析,一类偏算法模型。原创 2023-05-03 20:33:30 · 42 阅读 · 0 评论 -
AI技术内参136-如何组建一个数据科学团队?
数据科学团队眼下已经成了很多数据驱动型公司的标准配置,数据科学家也成了最“性感”的职业。不少公司都在想办法建立或扩展自己的数据科学团队,而究竟需要什么样的数据科学团队,成了很多公司在发展过程中都会遇到的棘手问题。在目前的职业市场上,有各种背景、各种经历的人都自称为“数据科学家”。那么,如何从这个蓬勃发展,却鱼龙混杂的人才市场中找到合适的团队成员呢?今天我就来和你聊一聊作为一个工程团队的负责人,或者一家公司的CEO,该如何招聘并打造自己的数据科学团队。原创 2023-05-03 20:32:59 · 108 阅读 · 0 评论 -
AI技术内参135-职场话题:聊聊数据科学家的职场规划
今天,我们继续来聊数据科学家或者人工智能工程师的职场话题。我们更进一步,来聊聊数据科学家的职场规划。当然,说到职场规划,这确实是一个非常宽泛的主题。我们今天要探讨的不是数据科学家“应该”怎么发展,而是说,,希望能够为你规划自己的职业生涯起到一个抛砖引玉的作用。原创 2023-05-03 20:32:23 · 163 阅读 · 0 评论 -
AI技术内参133-职场话题:当数据科学家遇见产品团队
我们在之前的分享中已经聊了数据科学家应该具备的基本能力,主要是希望从机器学习、统计知识、系统知识等方面给你一个完整的基本知识框架。然后我们聊了一些数据科学家的高阶能力,主要是能够通过分析产品、建立产品的评估体系以及对产品的长短期目标进行建模来系统性地提升产品性能。今天我们就把话题从数据科学家和人工智能算法工程师自身的修养和提升,扩展到一个更大的范围,那就是在职场中必然会遇到的发展和协作问题,我们来聊聊数据科学家和产品团队的关系这个话题。原创 2023-04-30 09:06:36 · 77 阅读 · 1 评论 -
AI技术内参132-数据科学家高阶能力之如何系统提升产品性能
人工智能工程师和数据科学家的一个核心任务,就是依靠人工智能、机器学习这样的工具来帮助产品不断提升品质,吸引更多用户,以实现既定的长期目标。这里有一个关键点,就是我们如何开发出一套方法论,让提升产品性能的过程可以“有章可循”,并成为一个系统性的流程。初入门槛的工程师和数据科学家,容易把精力和眼光都集中在具体的算法模型上面。这固然是短期内的重要工作,但是,如何能够持续不断地为产品提供前进的动力,才是让人工智能技术有别于之前多次技术浪潮的根本因素。原创 2023-04-30 09:05:40 · 69 阅读 · 0 评论 -
AI技术内参131-数据科学家高阶能力之评估产品
”(If you can’t measure it you can’t improve it.)这是一句你可能会经常听到的话,这句话也被应用到很多不同的场景中。那么,对于人工智能工程师和数据科学家来说,这句话其实是他们工作核心的核心。不管是模型和算法,还是产品迭代,都离不开“指标”和“评估”这两个方面。评估一个产品的好坏,是一项说起来最容易但做起来最困难的工作。任何人,从用户到产品经理,对某一个产品都可能有自己的主观意见。原创 2023-04-30 09:03:05 · 62 阅读 · 0 评论 -
AI技术内参130-数据科学家高阶能力之分析产品
人工智能工程师和数据科学家的主要工作是什么?很多人认为,他们的主要工作是利用复杂的机器学习模型和算法来解决产品中的难题。这样的认识既“对”也“不对”。“对”的地方是说,机器学习模型和算法的确是人工智能技术在产品上落地的核心步骤。“不对”的地方是说,这种认识往往片面地总结了人工智能从业人员的工作范畴。实际上,要想真正地提出一个好的人工智能解决方案,分析产品的能力是必需的。从较高的层次来讲,就是分析一个产品目前遇到的难题是什么,为什么需要用人工智能技术去解决,哪些是可以用人工智能技术解决的,哪些不能。原创 2023-04-30 09:03:29 · 82 阅读 · 0 评论 -
AI技术内参129-数据科学家基础能力之系统
对于初学人工智能的工程师或者数据科学家来说,在知识积累的过程中,“系统”往往是一个很容易被忽视的环节。特别是非计算机科学专业出身的朋友,一般都没有真正地建立过“系统”的概念,在今后从事人工智能的相关工作时,很可能会遇到一些障碍。今天我想给你分享一下,作为人工智能工程师和数据科学家,需要建立的关于“系统”的最基本认知。这些认知能够帮助你把书本的理论知识和现实的应用场景快速结合起来。原创 2023-04-29 08:27:16 · 288 阅读 · 0 评论 -
AI技术内参128-数据科学家基础能力之机器学习
想要成为合格的,或者更进一步成为优秀的人工智能工程师或数据科学家,机器学习的各种基础知识是必不可少的。然而,机器学习领域浩如烟海,各类教材和入门课程层出不穷。特别是机器学习基础需要不少的数学知识,这对于想进入这一领域的工程师而言,无疑是一个比较高的门槛。今天,我来和你聊一聊如何学习和掌握机器学习基础知识,又如何通过核心的知识脉络快速掌握更多的机器学习算法和模型。原创 2023-04-29 08:26:30 · 52 阅读 · 0 评论 -
AI技术内参127-数据科学家基础能力之概率统计
学习人工智能的工程师,甚至是在人工智能相关领域从业的数据科学家,往往都不重视概率统计知识的学习和培养。有人认为概率统计知识已经过时了,现在是拥抱复杂的机器学习模型的时候了。实际上,概率统计知识和数据科学家的日常工作,以及一个人工智能项目的正常运作都密切相关,。和机器学习一样,概率统计各个领域的知识以及研究成果浩如烟海。今天我就和你聊一聊,如何从这么繁多的信息中,掌握能够立即应用到实际问题中的概率统计知识,以及如何快速入手一些核心知识,并能触类旁通学习到更多的内容。原创 2023-04-29 08:25:33 · 109 阅读 · 0 评论 -
AI技术内参126-计算机视觉高级话题(三):产生式模型
GAN和深度学习的结合点在哪里呢?就是产生器和判别器可以分别是多层的神经网络,甚至可以是更加复杂的深度学习模型。这样,GAN的学习过程其实也就是两个不同的,各司其职的深度学习模型参数学习的过程。在近几年的发展中,基于GAN的各类模型层出不穷,而且能够产生的图片质量也越来越高,甚至有的真的达到了能以假乱真的程度。就在很多人都对这类模型充满了信心的时候,一些理论界的研究再次让大家对产生式模型,特别是GAN的前景萌生了怀疑。GAN能够彻底解决产生式模型的所有问题吗?原创 2023-04-29 08:24:20 · 71 阅读 · 0 评论 -
AI技术内参125-计算机视觉高级话题(二):视觉问答
今天,我们继续分享计算机视觉领域的高级话题,聊一聊“”(Visual Question Answering)这个话题。我们在前面曾经提到过“问答系统”(Question Answering),可以说这是人工智能领域最核心的问题之一。传统的问答系统主要是针对文字而言的,问题和答案都是以文字的形式表达的。当然,问答所针对的内容,有可能来自一个外在的知识库,例如维基百科。原创 2023-04-29 08:23:59 · 330 阅读 · 0 评论 -
AI技术内参124-计算机视觉高级话题(一):图像物体识别和分割
从今天开始,我们讨论几个相对比较高级的计算机视觉话题。这些话题都不是简单的分类或者回归任务,而是需要在一些现有的模型上进行改进。我们聊的第一个话题就是图像中的(Object Recognition)和我们前面介绍过物体识别和分割。通俗地讲,就是给定一个输入的图像,我们希望模型可以分析这个图像里究竟有哪些物体,并能够定位这些物体在整个图像中的位置,对于图像中的每一个像素,能够分析其属于哪一个物体。原创 2023-04-29 08:23:24 · 413 阅读 · 0 评论 -
AI技术内参123-计算机视觉领域的深度学习模型(三):ResNet
今天我们继续来讨论经典的深度学习模型在计算机视觉领域应用。今天和你分享的论文是《用于图像识别的深度残差学习》(Deep Residual Learning for Image Recognition)[1]。这篇论文获得了CVPR 2016的最佳论文,在发表之后的两年间里获得了超过1万2千次的论文引用。原创 2023-04-29 08:22:16 · 133 阅读 · 0 评论 -
AI技术内参122-计算机视觉领域的深度学习模型(二):VGG&GoogleNet
在上第一期的分享中,我们通过一篇经典论文讲了AlexNet这个模型。可以说,这篇文章是深度学习在计算机视觉领域发挥作用的奠基之作。AlexNet在2012年发表之后,研究界对这个模型做了很多改进工作,使得这个模型得到了不断优化,特别是在ImageNet上的表现获得了显著提升。今天我们就来看看针对AlexNet模型的两个重要改进,分别是VGG和GoogleNet。原创 2023-04-29 08:21:13 · 174 阅读 · 0 评论 -
AI技术内参119-基于深度学习的计算机视觉技术(二):基本的深度学习模型
例如,我们有一个“4乘4”,一共16个单元的矩阵,如果我们针对每个“2乘2”的区域加以最大值(Max Pooling)池化,那么我们就可以把16个单元的数据总结为“2乘2”,也就是一共4个单元的数据。每个单元是原来矩阵中“2乘2”区域中的最大值。当一个图像经过了卷积和池化等一系列的操作以后,我们就说已经提取了这个图像的关键特征。这个时候,我们往往会把数据经过基本的前馈神经网络来进一步融合,最后能够完整地总结数据信息。在前馈神经网络之后,这就又是一个线性的决策层,可以是回归,也可以是分类。原创 2023-04-29 08:20:21 · 152 阅读 · 0 评论 -
AI技术内参118-基于深度学习的计算机视觉技术(一):深度神经网络入门
在了解一些深度学习技术细节之前,我们首先要来看一下为什么需要深度学习技术。初学者经常会有一个误区,那就是认为和“深度学习”相对的就是“浅层学习”(Shallow Learning)。这种看法也对,也不对。“对”的地方在于“深度学习”的确强调从数据或者说是特征(Feature)中构造多层或深度的变换,从而能够得到非线性的表征(Representation)。显然,这种效果是线性模型所达不到的。原创 2023-04-29 08:18:54 · 139 阅读 · 0 评论 -
AI技术内参117-计算机视觉中的特征提取难在哪里?
在上一次的分享中,我们聊了计算机视觉的一些最基础的操作和任务,包括像素表达和过滤器这两个视觉问题。我们还简单介绍了边界探测这个任务,了解如何从计算机视觉的角度来对这个任务进行建模。今天,我们来看计算机视觉基础问题中的另一个核心任务,那就是特征(Feature)提取。原创 2023-04-28 08:08:21 · 208 阅读 · 0 评论 -
AI技术内参116-掌握计算机视觉任务的基础模型和操作
今天,我们来聊一聊计算机视觉的一些最基础的操作和任务,包括像素表达、过滤器和边界探测。基于这些内容,我们一起讨论利用计算机来处理视觉问题的核心思路。很多时候,越是基础的内容就越重要,因为只有掌握了基础的思路,我们才能在今后复杂的任务中灵活应用。原创 2023-04-28 08:05:18 · 76 阅读 · 0 评论 -
AI技术内参115-什么是计算机视觉?
关于计算机视觉(Computer Vision,CV),有两种人们普遍接受的定义。第一种定义认为,计算机视觉是从数字图像(Digital Images)中提取信息。这些信息可以是图像中的物品识别(Identification)、导航系统的位置测量(Space Measurement)以及增强现实(Augmented Reality)的应用。计算机视觉的第二种定义主要是从应用的角度出发,认为计算机视觉是为了构建可以理解数字图像内容的算法,从而有多种应用。那到底什么是计算机视觉呢?主要解决哪些问题?原创 2023-04-28 08:02:16 · 69 阅读 · 0 评论 -
AI技术内参114-文本情感分析中如何做意见总结和搜索?
为什么“意见总结”这个任务会很重要的呢?假如你希望在电商网站上购买一款数码相机。这个时候,你可能需要打开好几款相机的页面进行比较。对于相机的硬件指标,能够从这些页面上相对容易地直接得到,除此以外,你可能还比较关心对这些相机的评价。在这个场景下,“意见总结”的重要性就凸显出来了。因为优秀的相机款式往往有上百甚至上千的用户评价,这些评价包括了用户对产品很多方面的评价,有褒义和贬义的情绪。如果对这些评价逐一进行浏览,很明显是一种非常低效的做法。原创 2023-04-28 07:54:22 · 84 阅读 · 0 评论 -
AI技术内参113-如何来提取情感“实体”和“方面”呢?
今天,我为你介绍了一类基础的文字情感分析任务——情感“实体”和“方面”的提取。一起来回顾下要点:第一,我们介绍了什么是情感“实体”和“方面”;第二,我们聊了目前在这个方向上比较通行的一些方法,比如基于“频率”的提取,利用句子的一些特殊结构等。最后,给你留一个思考题,除了我们介绍的这些方法,你还能想到其他方法来提取实体和方面的关键词吗?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:52:59 · 99 阅读 · 0 评论 -
AI技术内参112-什么是文档情感分类?
今天我为你介绍了一类基础的文字情感分析任务——文档情感分类的基本技术要点。一起来回顾下要点:第一,我们讲了基于监督学习的文档情感分类任务以及这类任务下的重要特性和模型;第二,我们聊了如何在没有大规模训练数据的基础上进行非监督的文档情感分类。最后,给你留一个思考题,如何把文档情感分类任务扩展到可以针对多种实体多种情感的分析呢?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:51:25 · 72 阅读 · 0 评论 -
AI技术内参111-聊天机器人有哪些核心技术要点?
今天我为你介绍了非任务型对话系统的基本技术要点。一起来回顾下要点:第一,我们讲了基于信息检索,也就是搜索技术的对话系统;第二,我们聊了聊如何利用RNN或者是序列模型对对话系统进行建模。最后,给你留一个思考题,你觉得在什么样的条件下,非任务型聊天机器人可以展现出真正的“人工智能”呢?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:47:48 · 247 阅读 · 0 评论 -
AI技术内参110-任务型对话系统有哪些技术要点?
今天我为你介绍了任务型对话系统的基本技术要点。一起来回顾下要点:第一,我们复习了任务型对话系统的基本组件;第二,我们进一步聊了这些组件的一些最基础的技术要点和背后的模型思想。最后,给你留一个思考题,任务型对话系统需要每个组件单独进行学习还是尽可能把所有组件连在一起进行训练?这两种方法的优劣在什么地方呢?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:46:55 · 141 阅读 · 0 评论 -
AI技术内参109-对话系统之经典的对话模型
今天我为你介绍了对话系统的一些基础的背景信息。一起来回顾下要点:第一,我们讲了什么是对话系统,对话系统从方法论上来说有什么流派;第二,我们聊了对话系统的分类;第三,我们分析了对话系统的基本架构。最后,给你留一个思考题,你认为,让对话系统能够真正智能的最大挑战是什么?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:45:34 · 501 阅读 · 0 评论 -
AI技术内参108-RNN在自然语言处理中有哪些应用场景?
今天我为你介绍了文本序列建模利器RNN的几个应用场景。一起来回顾下要点:第一,我们讲了用RNN对句子层级进行分类任务的处理;第二,我们聊了如何把RNN当作普遍使用的特性提取器来进行分类任务的训练,特别是POS标签任务。最后,给你留一个思考题,利用RNN提取的信息能否完整捕捉文档里的内容,这一点我们怎么来判断呢?欢迎你给我留言,和我一起讨论。原创 2023-04-28 07:45:09 · 275 阅读 · 0 评论 -
AI技术内参107-基于门机制的RNN架构:LSTM与GRU
今天我为你介绍了文本序列建模利器RNN的几个实例。一起来回顾下要点:第一,我们复习了RNN的基本概念和框架;第二,我们聊了两个带有门机制的经典的RNN模型,分别是LSTM和GRU。最后,给你留一个思考题,RNN需要门机制,你认为到底是建模的需要,还是需要解决梯度异常的问题从而能够让优化算法工作?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:41:51 · 224 阅读 · 0 评论 -
AI技术内参106-序列建模的深度学习利器:RNN基础架构
今天我为你介绍了文本序列建模利器RNN的一个概况。一起来回顾下要点:第一,我们讨论了为什么需要对文本的序列数据进行建模;第二,我们聊了聊传统机器学习模型是如何对序列进行建模的;第三,我们分享了RNN的基本的加码解码的框架。最后,给你留一个思考题,对比HMM,RNN的优势有哪些?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:41:04 · 97 阅读 · 0 评论 -
AI技术内参105-Word2Vec算法有哪些应用?
今天我为你介绍了Word2Vec模型在各种实际任务中的应用。一起来回顾下要点:第一,我们聊了Word2Vec这个模型的一些简单应用,比如如何计算词与词之间的相关度,以及如何进行词的类比计算;第二,我们讨论了如何利用词向量进行更加复杂的自然语言任务的处理。最后,给你留一个思考题,Word2Vec和主题模型提供的向量,是互补的还是可以相互替换的呢?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:38:52 · 138 阅读 · 0 评论 -
AI技术内参104-Word2Vec算法有哪些扩展模型?
今天我为你介绍了Word2Vec模型扩展的一些基本思路和一些实际的案例。一起来回顾下要点:第一,我们讨论了Word2Vec这个模型需要扩展的思路,比如从离散数据入手或者从上下文入手;第二,我们分享了三个比较经典的Word2Vec扩展。最后,给你留一个思考题,Word2Vec能否扩展到连续数据中呢?欢迎你给我留言,和我一起讨论。参考文献。原创 2023-04-27 08:36:54 · 104 阅读 · 0 评论 -
AI技术内参103-为什么需要Word2Vec算法?
首先我们需要说明的是,Word2Vec是一种语言模型,主要是根据当前的语境,来预测下一个单词出现的概率,也就是和我们之前所说的产生式模型相似,看是否能够从模型中产生单词。这和我们介绍的主题模型是不一样的,在这个模型里,我们并没有假定数据(也就是单词)是从某几个主题中产生的。Word2Vec的核心思想是,当前的单词是从周边单词的隐含表达,或者说是词向量中产生的。也就是说,每一个单词都依赖于上下文,而这个单词的产生,并不是直接依赖周围单词的离散表达,而是依赖周边单词的连续表达。原创 2023-04-27 08:35:55 · 75 阅读 · 0 评论 -
AI技术内参102-基础文本分析模型之三:EM算法
今天我为你介绍了一个经常用于求解概率图模型的EM算法。一起来回顾下要点:第一,我们回顾了EM算法和MLE算法的关系;第二,我们讨论了EM算法的核心思想。最后,给你留一个思考题,EM算法在实际应用中有哪些问题呢?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:35:29 · 78 阅读 · 0 评论 -
AI技术内参101-基础文本分析模型之二:概率隐语义分析
今天我为你介绍了基于概率模型的隐语义模型的相关知识。一起来回顾下要点:第一,我们简要回顾了隐语义模型的重要性;第二,我们讨论了基于概率语言的隐语义模型的核心思想,以及PLSA和LDA的联系和区别。最后,给你留一个思考题,PLSA的建模流程有没有什么局限性?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:33:48 · 72 阅读 · 0 评论 -
AI技术内参100-基础文本分析模型之一:隐语义分析
今天我为你介绍了基于矩阵分解的隐语义模型的相关知识。一起来回顾下要点:第一,我们聊了聊为什么需要隐语义模型;第二,我们聊了一下基于矩阵分解的隐语义模型的核心思想及其局限。最后,给你留一个思考题,如果我们要限制矩阵分解的结果是非负数,我们应该怎么做呢?欢迎你给我留言,和我一起讨论。原创 2023-04-27 08:28:37 · 253 阅读 · 0 评论 -
AI技术内参098-LDA变种模型知多少
今天我为你梳理了LDA的扩展模型。LDA的扩展当然还有很多,我们今天讨论了几个非常经典的扩展思路,分别是基于上游、下游和时间序列的LDA扩展模型。一起来回顾下要点:第一,我们回顾了LDA这个模型的核心思想;第二,我们聊了如何把文档的其他信息融入到LDA模型中去,以及如何对时间信息进行建模。最后,给你留一个思考题,如果我们希望利用LDA来对“用户对商品的喜好”进行建模,应该怎么对模型进行更改呢?欢迎你给我留言,和我一起讨论。参考文献。原创 2023-04-27 08:27:38 · 169 阅读 · 0 评论