为进一步推动高等院校人工智能教学工作的开展,加强国内各高等院校同行间的交流,培养国内的师资力量,将人工智能最新实训内容带入课堂,特举办“人工智能系列课程理论与实践”高级培训班。
该培训定于2021年7月20日开始,共包含七大专题,每个专题5天左右,共计30天,通过线上直播的方式进行集训。七大专题分别为Python机器学习,图像识别与深度学习,深度学习与NLP,知识图谱、图神经网络和强化学习,深度学习PyTorch理论与实战。本次培训由权威专家主讲,提供实验环境及实验数据,并提供配套资料,通过剖析工程案例展现机器学习、深度学习、强化学习落地全过程。
一、 培训安排
l 2021年7月20日—2021年8月22日(其中,在线直播30天,07.25、07.31、08.06、08.14休息)
时间安排 培训内容 培训时间 地点
每晚 19:30-22:00 支持回放
线上直播 ,支持回放
7月20日—7月24日(共5天)
Python机器学习
7月26日—7月30日(共5天)
图像识别与深度学习
8月1日—8月5日(共5天)
深度学习与NLP
8月7日—8月10日(共4天)
知识图谱
8月11日—8月13日(共3天)
图神经网络
8月15日—8月19日(共5天)
强化学习
8月20日—8月22日(共3天)
深度学习PyTorch理论与实战
二、 培训对象
(1)高等院校
人工智能、数据科学相关学科;计算机、网络通信、自动化、电子工程、 数理统计、电子商务、物联网工程、物流管理、信息与计算科学等专业的科研、教学带头人,骨干教师、博士生、 硕士生;
(2)从事人工智能,计算机、数据科学、互联网等相关领域的科研院所的项目负责人、科研人员、工程技术人员。
(3)各地方政府信息中心负责人、 技术骨干。
(4)互联网产业投资团队——人工智能,数据科学方向。以及应用开发商, 服务提供商等。
(4)有志于数据分析,机器学习研究和应用的从业者。
三、 培训目标
(1)、学习掌握使用 Python 编程语言来进行数据爬取、数据分析、机器学习等操作。
(2)、学习掌握机器视觉技术中图像识别与目标侦测,包括图像处理,图像特征抽取,特征学习,以及基于卷积神经网络的一些机器学习算法和应用。
(3)、掌握 python 实现中文自动分词,词性标注,句法分析,自然语言生成,文本分类,信息检索,信息抽取,文字校对,问答系统,机器翻译,自动摘要,文字蕴涵。
(4)、掌握知识图谱基础知识,领域应用和学术前沿趋势,掌握解知识图谱核心技术。掌握知识图谱在语义搜索、问答系统、个性化推荐等领域的应用。
(5)掌握图神经网络的基本知识,以及多种高级的算法:DeepWalk和GraphSage、GCN等,并能够实现图神经网络算法。
(6)、系统掌握强化学习各经典算法(基础求解法和联合求解法)的技术原理,能够编程实现各经典算法。掌握迷宫寻宝、飞翔的小鸟、小车倒摆、钟摆、AlphaGO、AlphaGO Zero、AlphaZero的技术原理和代码实现。
(7)轻松学会使用PyTorch实现各类机器学习、图像处理、自然语言处理、生成式深度学习、强化学习等。
四、培训专家
邹博(邹伟),睿客邦创始人,华东建筑设计研究院研究员、山东交通学院客座教授、硕士生导师,南昌航空大学双师型教师、中国软件行业协会专家委员、上海市计划生育科学研究所特聘专家、天津大学创业导师、中国医药教育协会老年运动与健康分会学术委员、《聊城大学学报》编委;睿客邦当前进入发展第4年,已经与全国十多所高校建立了AI联合实验室,完成和在研50多个AI工业项目,广泛应用于医疗、交通、农业、气象、银行、电信等多个领域。合作企业有:中国电信、中国移动、CSDN,中国建设银行等。在国内外期刊会议发表论文10 余篇,获得国家发明专利1 项,著书1本,译书6本。
五、培训内容
专题一:Python网络爬虫、数据分析及机器学习
课程简介
通过大量案例快速介绍 Python 运算符、表达式、内置函数,列表、元组、字典、集合,以及等内容。学习完这些基础内容之后,重点学习python网络爬虫、网络爬虫原理与应用、numpy 数组运算与矩阵运算、pandas 数据分析、matplotlib数据可视化以及 sklearn 机器学习等方面的内容,结合最新的案例进行实战。
课程特点
1) 报名赠送全部PPT和案例源代码、实验录播课及实验手册等资源。
2) 全案例教学,边讲边练,实战性强,助教辅导,力争让每位学员掌握所学内容。
课程大纲
1、Python基础学习
解释器Python2.7/3.x、IDE:Anaconda/Pycharm
列表/元组/字典/类/文件
Python安装与环境配置
Python基本数据类型:list, dict, tuple, set等
Python文件操作:txt, excel等
Python 的标准库
Python高级用法:切片、迭代、map、filter、reduce
代码和案例实践:
公路堵车概率模型Nagel-Schreckenberg实现
负二项分布与比赛胜率
本福特定律
蝴蝶效应:Lorenz系统的三维绘制
2、python网络爬虫
字符串重要方法应用
中英文分词,拼音处理
网页文本提取与图片下载
简单反爬机制对抗
代码和案例实践:
《青春有你2》选手数据爬取与分析
《安家》影评爬取与数据分析
《乘风破浪的姐姐》数据爬取与分析
《平凡的荣耀》数据爬取与分析
中国工程院院士信息爬取与分析
爬取某学校所有新闻
演员数据分析,最受欢迎的演员、关系最好的演员组合
3、Python数据分析
Numpy/Scipy/Pandas/Matplotlib/Seaborn库
Numpy基础属性与数组创建
Numpy索引
Numpy数学运算与常用分布
Pandas数据处理与分析
Pandas文件读写和个性化控制
Pandas的concat与merge
Matplotlib 基本图结构介绍
基于Matplotlib绘制散点图、柱状图、等高线图、3D图等
多图合并与图片文件存取
scikit-learn的介绍和典型使用
XGBoost、LightGBM
多元高斯分布
典型图像处理
多种数学曲线
多项式拟合
代码和案例实践:
股票数据分析
图像处理与奇异值分解SVD
饭店营业额数据分析
散点图,商场内手机信号强度分布,烧烤店营业额
饼状图,学生成绩分布
4、回归分析
线性回归
Logistic/Softmax回归
广义线性回归
L1/L2正则化
Ridge与LASSO
Elastic Net
梯度下降算法:BGD与SGD
特征选择与过拟合
Softmax回归的概念源头
最大熵模型
K-L散度
代码和案例实践:
线性回归算法儿童身高预测
股票数据的特征提取和应用
泰坦尼克号乘客缺失数据处理和存活率预测
环境检测数据异常分析和预测
二手车数据特征选择与算法模型比较
广告投入与销售额回归分析
鸢尾花数据集的分类
5、决策树和随机森林
熵、联合熵、条件熵、KL散度、互信息
最大似然估计与最大熵模型
ID3、C4.5、CART详解
决策树的正则化
预剪枝和后剪枝
Bagging Boosting AdaBoost GBDT XGBoost
随机森林
不平衡数据集的处理
利用随机森林做特征选择
使用随机森林计算样本相似度
异常值检测
代码和案例实践:
根据三围信息判断性别
葡萄酒数据集的决策树/随机森林分类
泰坦尼克乘客存活率估计
6、SVM
线性可分支持向量机
软间隔
损失函数的理解
核函数的原理和选择
SMO算法
支持向量回归SVR
多分类SVM
代码和案例实践:
支持向量机手写数字图像识别
原始数据和特征提取
调用开源库函数完成SVM
数字图像的手写体识别