在人工智能时代下,机器学习、深度学习、大数据分析与处理、云计算等新技术的提出极大地促进了Python语言的发展,2017年IEEE Spectrum 发布的编程语言交互式排行榜上,Python独占榜首。Python以面向对象、容易学习、跨平台以及由此产生的低维护成本,深受Python爱好者喜欢并获得好评。
正是基于此,教育部高等学校计算机类教学指导委员会计划举办本次Python课程高级研修班,这次培训班的内容既有Python课程的的深度介绍,也有以Python为工具进行比较前沿的数据分析、爬虫的开发。
一、课程目标
- 掌握Python语言基础和编程方法,以及Python与其他语言的异同。
- 以Web新闻页面的采集、内容提取、处理及分析为应用案例和主线,掌握互联网大数据处理的关键技术和整个处理流程,使得参加培训的教师具备互联网大数据处理技术的知识体系。
- 学习掌握Web页面采集的爬虫技术架构及其Python实现方法,学习Web信息提取的技术原理,并掌握利用若干开源框架进行Web提取的方法。使参加培训的教师可以开设Web大数据采集的专业核心课程,并具备互联网大数据处理技术相关课程的实验设计能力。
二、课程内容及时间安排
2018年11月3日(星期六) | |
08:30-09:10 | 开幕式 |
单元 1:Python语言基础与梳理 | |
09:10-11:10 | 介绍Python语言变量、数据类型、列表、字典、元组、函数、类及文件操作 介绍开发环境、主要的编程方法 介绍C、Java等经典语言与Python语言的异同,梳理语言发展的一些特征规律 |
11:10-11:50 | 上机实践(基础编程) |
单元 2:Web数据采集技术 | |
14:00-16:30 | 介绍Web数据采集技术原理,包括基本架构、Web连接、URL处理、爬行策略、Robots协议、Cookie等技术 以新闻信息采集为例,介绍Web页面采集的Python实现方法 |
16:30-17:30 | 上机实践(采集新闻网站的科技类、财经类、体育类的HTML页面) |
2018年11月4日(星期日) | |
单元 3:Web信息提取技术 | |
9:00-11:00 | 介绍Web信息提取技术原理,包括信息提取的目标、DOM树、基于树结构的提取技术、基于统计方法的方法 Python实现方法,包括若干个开源框架及使用方法、比较和选择 |
11:00-11:50 | 上机实践(对新闻页面进行内容提取,生成文本集) |
单元 4:数据分析技术 | |
14:00-16:30 | 介绍数据处理技术的原理,包括词汇切分、词性识别、停用词过滤、人名识别等 数据分析与实现:词频统计、主题建模、基于Tensorflow进行CNN新闻分类等 可视化:工具、Python实现 |
16:30-17:30 | 上机实践(对Web信息提取的文本集进行处理和分析) |
会议结束 |
实操训练
本次培训设有四个现场实操辅导训练项目,以帮助参加培训的教师更好地掌握培训内容,提升实战技能,为后续课程开设做充分准备。
三、授课教师
曾剑平,男,博士,现为复旦大学计算机科学技术学院副教授、硕士生导师。
曾供职于软件公司并担任总工程师,在企业信息化方面做了大量工作,带领团队完成了多项创新研究应用开发项目,在全国多个省市得到推广应用,并于2004年由信息产业部认定为计算机软件高级系统分析师。
担任InternationalJournal of Network Security(信息安全、EI源刊)、Journal of Emerging Technologies in Web Intelligence(Web智能)、《计算机工程与应用》等多个国内外知名学术期刊的编委。担任WorldWide Web Journal、Knowledge-based Systems、IEEE SMC、IEEE TKDE、JCST、计算机科学、小型微型计算机系统等多个国内外学术期刊的审稿专家。近十多年来,申请专利10多项,其中5项为授权发明专利(第一发明人),获得1项软件著作权(第一完成人)。主持国家自然科学基金面上项目、上海市自然科学基金项目、教育部课题以及企业委托项目多项,参与国家重点科技计划、国家信息化专家咨询委员会、国家保密局、上海科委以及企业合作等项目研究。
目前主要研究方向是社交媒体分析及应用、网络舆情分析技术和大数据安全。作为第一作者和通讯作者发表相关技术方向的论文60多篇,其中有10多篇是在国际著名学术期刊上。2017年出版《互联网大数据处理技术与应用》专著,并获得同行好评。
四、培训证书
对经学校有关部门推荐参加培训的教师,考评合格后由教育部高等学校计算机类专业教学指导委员会颁发“全国高校Python数据分析课程高级研修班”结业证书,对参加培训获得证书的教师,所在学校应承认其接受培训的经历,计入继续教育学时。