一、周志华《机器学习》西瓜书训练营
【第一阶段】
1.了解机器学习基本概念
2.线性模型
3.入门比赛:“达观杯”NLP算法大赛
【第二阶段】
1.支持向量机
2.贝叶斯分类器
3.入门比赛:“达观杯”NLP算法大赛(其他算法进阶应用)
【第三阶段】
1.决策树
2.集成学习
3.进阶比赛:决策树和集成学习应用于天池o2o优惠券使用预测赛
【第四阶段】
1.特征选择
2.降维
3.进阶比赛:特征选择和降维应用于天池o2o优惠券使用预测赛
【第五阶段】
1.模型的评估与选择
2.神经网络与深度学习
3.进阶比赛:模型评估与选择应用于天池o2o优惠券使用预测赛
【第六阶段】
1.概率图模型
2.聚类
3.强化学习
4.进阶比赛:强化学习应用于天池o2o优惠券使用预测赛
二 全国高校大数据与人工智能双师型骨干师资研修班
第一部分:线上实习(基础部分共计35个课时) | 学习时间 | 报名后即可开始学习 | ||
学习地址https://edu.tipdm.org/course/7(Python快速入门),备注:该部分内容是前导课,请一定提前学习。 | ||||
课程模块 | 内容 | 课时 | ||
Python基础 | 1 准备工作 1.1 认识Python 1.2 搭建Python环境 1.3 安装PyCharm并创建一个应声虫程序 2 Python基础知识 2.1 掌握Python固定语法 2.2 创建字符串变量并提取里面的数值 2.3 计算圆形的各参数 3 Python数据结构 3.1 创建一个列表(list)并进行增删改查操作 3.2 转换一个元组(tuple)并进行取值操作 3.3 创建一个字典(dict)并进行增删改查操作 3.4 将两个列表转换为集合(set)并进行集合运算 4程序流程控制语句 4.1实现考试成绩划分 4.2实现一组数的连加与连乘 4.3使用冒泡排序法排序 4.4实训(猜数字游戏) 5 函数 5.1自定义函数实现输出方差 5.2使用匿名函数添加列表元素 5.3存储并导入函数模块 6 面向对象 6.1 认识面向对象编程 6.2 创建Car类 6.3 创建Car对象 6.4 迭代Car对象 6.5 产生Land_Rover对象(子类) 7 文件基础 7.1 认识文件 7.2 读取txt文件中的数据 7.3 保存数据为csv格式文件 7.4 认识os模块 | 15 | ||
Python数据分析与应用 | 1 Python数据分析概述 1.1认识数据分析 1.2熟悉Python数据分析的工具 1.3安装Python3的Anaconda发行版 1.4掌握Jupyter Notebook常用功能 2 NumPy数值计算基础 2.1认识NumPy数组对象ndarray 2.2认识NumPy矩阵与通用函数 2.3利用NumPy进行统计分析 3 Matplotlib数据可视化基础 3.1了解绘图基础语法与常用参数 3.2分析特征间的关系 3.3分析特征内部数据分布与分散状况 4 Pandas统计分析基础 4.1读写不同数据源的数据 4.2掌握DataFrame的常用操作 4.3转换与处理时间序列数据 5 使用Pandas进行数据预处理 5.1合并数据 5.2清洗数据 5.3标准化数据 5.4转换数据 | 20 | ||
第二部分:线下实战(实部分共计40个课时) | 学习时间 | 2020年1月12-16日 | ||
日期 | 内容 | 时间 | ||
第一天 | 报到 | 全天 | ||
第二天 | 大数据人才培养方案/课程设置分享 | 09:00-09:30 | ||
实战任务说明及启动 | 09:30-09:45 | |||
Python数据分析与处理实训 实训1开始了解你的数据-餐饮数据探索 实训2数据过滤与排序-欧洲杯数据与分析 实训3数据分组-酒类消费数据探索 实训4Apply应用-犯罪数据探索与处理 实训5数据框合并综合应用 实训6时间序列数据处理-股价数据分析与处理 实训7统计分析-招聘数据探索与分析 | 09:45-12:00 14:00-17:00 | |||
第三天 | 机器学习算法挑战赛与教学转化 1 机器学习介绍 1.1有监督学习:分类、回归 1.2无监督学习:聚类 1.3半监督学习 1.4强化学习 2 算法挑战赛:能力提升与教学转化 2.1赛题分析 2.2数据准备 2.3数据预处理 2.4特征工程 2.5使用scikit-learn构建模型 2.6集成学习 2.7成果提交 2.8案例总结与教学转化 | 09:00-12:00 14:00-17:00 | ||
第四天 | Python网络爬虫实战 1 Python爬虫环境与爬虫简介 1.1认识爬虫 1.2认识反爬虫 1.3配置Python爬虫环境 2 网页前端基础 2.1认识Python网络编程 2.2认识HTTP协议 3 简单静态网页爬取 3.1实现HTTP请求 3.2解析网页 3.3数据存储 4 常规动态网页爬取 4.1逆向分析爬取动态网页 4.2使用Selenium库爬取动态网页 4.3存储数据至MongoDB数据库 5 模拟登录 5.1使用表单登录方法实现模拟登录 5.2使用Cookie登录方法实现模拟登录 6 终端协议分析 7 项目实战:大数据岗位招聘数据爬取及分析 | 09:00-12:00 14:00-17:00 | ||
第五天 | 人工智能应用实战 1 TensorFlow安装与入门 1.1 TensorFlow环境搭建 1.2 TensorFlow计算模型性:计算图 1.3 TensorFlow数据模型:张量Tensor 1.4 TensorFlow运行模型:会话 2 TensorFlow数据类型 2.1 常量、变量及其构建 2.2 TensorFlow实现线性回归模型 2.3 操作:TensorFlow实现鸢尾花分类 3案例一:手写数字识别 3.1 图片预处理 3.2 占位符:placeholder 3.3 操作:利用TensorFlow实现SoftMax网络对手写数字识别 4案例二:基于深度神经网络的车牌号识别 4.1数据读取 4.2定位并截取车牌图片 4.3灰度处理车牌图片 4.4降噪处理车牌图片 4.5车牌分割 4.6卷积神经网络(CNN)的处理层构建 4.7定义损失函数、优化器 4.8计算正确率 4.9执行训练并保存模型 4.10模型调用并测试评估 | 09:00-12:00 14:00-17:00
| ||
第六天 | 大数据企业参观访学习 |