本文主要是简介,具体内容、相关代码及数据集文件请查看网页链接:http://www.icxbk.com/article/detail/579.html
相信正在看的各位伙伴应该对人工智能、深度学习、机器学习这些名词已经非常耳熟了。这些年来,人工智能的概念越来越热,无论各国学者,还是国家政策,都在提人工智能。似乎各行各业都可能会被人工智能影响,更有甚者,很多职业也会被人工智能所取代。
目前,人工智能的研究核心还是机器学习。那么什么是机器学习?如何使用机器学习来解决一些实际问题?希望阅读完这篇文章能解答一些你的困惑。
其实,机器学习、深度学习技术就应用在我们身边,现在我们的日常生活已经离不开机器学习的产物了。比如:当你在淘宝点开一个链接浏览了或者购买了某个宝贝,那么它会向你智能推荐一些相关的商品。比如你在今日头条上浏览了某哥网页中包含商品信息,那么京东就会向你智能推荐一些商品,大大刺激了消费。还比如,现在手机都内置AI摄影功能,你只需镜头对向物体,它会自动识别出物体类型并作出针对性优化调教。当然还有很多…….
机器学习大致可分为:监督学习、半监督学习、非监督学习、强化学习;简单解释一下,不作深入讨论。监督学习就是数据集有特征值、有标签,非监督学习就是数据集有特征值、无标签。
目前在计算机视觉和NLP领域非常红火的深度学习也是属于机器学习的一种,对于监督式机器学习两个部分:特征和标签。本文研究的视频评分的影响因素问题也是一个监督学习问题,特征主要包括视频播放量、收藏量、弹幕数,标签就是视频评分;
机器学习包括三个部分:输入、学习模型、输出。用比较通俗的语言解释就是:往学习模型中输入数据集,经过学习算法自学习过程,训练得到模型。将输入的特征与输出标签建立映射关系,通过机器学习算法的训练过后得到的模型,只需要输入特征值(feature)后,可直接得到标签值(label)。
实验具体实例:使用机器学习方法分析B站视频评分的影响因素
实验环境:本篇文章的实现代码通过Tensorflow实现,编程语言为Python3,软件平台为Anaconda3 jupyter notebook。
主要步骤包括:1.数据获取及处理 2.数据集划分 3.机器学习模型训练 4.使用模型预测