“Garbage in, garbage out !”,在计算机科学界一直广为流传!这句话放到数据科学上也同样成立,
高质量的数据永远排在第一位。但是数据总会存在不完整、噪声、不一致、错误值、离群值、重复各种问题,数据集特征也形形色色的。也许不学特征工程也可以建模深度学习,但是一定没法建好模型;你还在苦苦调参,如何训练精度都不高吗?也许是数据预处理的锅,也许是特征没选对。因此,
数据准备和特征工程作为数据科学、机器学习、深度学习等各类项目中不可或缺的环节,是每个从业者必须熟练掌握相关操作技能。在此基础下,齐伟老师研发了《数据准备和特征工程》课程,课程涵盖了感知数据、数据清理、特征变换、特征选择、特征抽取等内容。
注重基础和前沿相结合,以案例为载体,传授思想方法,让更多学生能够真正掌握知识。毕竟,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已!巧妇难为无米之炊,而
数据准备和特征工程,就是为深度学习提供"米"。为了更有利于学习者学习,免除不必要的麻烦,高效学习。齐伟老师将本课程在AI Studio上发布。
面向全社会提供免费课程服务,大家只要登录AI Studio,就能立刻学习专业的大学实践课程。
课程大纲
主讲教师
学习收获
认真学完本课程代码后,你将能够: 1、掌握数据准备、数据清理、特征工程的常用方法。 2、了解工程实践中相关操作要求和方法。 3、为深度学习等相关的项目开发者提供有关技术指导和启发。课程优势
注重工程实践:通过大量案例,向学习者演示了各种方法的具体实现方式。 基础与前沿结合:考虑到现实项目的复杂性,在具体项目中用到各种工具及最新的研发成果,为此专设了“扩展探究”供学习者了解更多精彩内容。 以案例为载体,传授思想方法:以“项目案例”为载体,不仅讲述操作技法,还让学习者体验其中的思想方法,并且在“动手练习”中提供了练习项目,供学习者检验和巩固所学内容。学员评价
即便需求紧跟业务千变万化,但是 处理数据的流程和思路却万变不离其宗。机缘巧合看到了数据处理及特征工程相关的公开课,因和平常工作紧密相关,于是抱着极大的兴趣听完了课程,收获颇丰。时间所限单次公开课仅阐述其中一个点,一个问题,一个场景,但 抛出了多种解决方案,几乎覆盖了常用的几种方法,且能举一反三。——玉环(数据工程师)对于每一个现实生活中的落地项目来说,最大的投入往往在数据准备阶段,这也是最具决定性的阶段。数据的缺陷,是难以通过模型改进来解决的。而反之,如果数据足够多,足够准,无论你用多简单的模型,也能获得一个令人满意的成果。 总的来说,无论你是处理日常办公的数据,还是想深入学习人工智能,都能为你的发展打下坚实的基础。——洪贤斌博士1、语言风趣幽默,文字朴实简练,极易引起阅读的兴趣;2、基础知识点详细,分析逻辑清晰,有理有据;3、指导性学习,间接地指导学习的方法;4、框架和体系完整,对于学习的技能有引导性的意义。 通过齐老师讲解的通俗易懂的方式,跟随老齐的思维打开机器学习的大门!——车啸(甘肃某高校)学员要求
学习本课程,需要学员具有如下前置知识:· Python基础知识· 熟练使用Numpy、Pandas、Matplotlib· 会应用scikit-learn· 在学习过程中,将本课程中的代码与部分视频和书籍对照学习使用,尽可能将代码逐一调试,理解其含义。配套书籍
* 本课程是与《数据准备和特征工程》一书配套的公开课。学习者可以参考书上的详细说明,并配合本课程的视频及代码进行学习。报名通道
此套课程已经公开在AI Studio,大家扫描下方二维码,即可开启你的学习之旅~