前言
互联网已经成为信息传播的主要载体,并逐步成为现代社会的必需品。
互联网中的数据体量爆炸式增长,有价值的信息淹没在茫茫多的数据海洋中。
Web信息处理的目标是提供从海量数据中挖掘高价值信息的工具集合。
课程框架
Web数据获取
Web数据获取
- 爬虫基本架构
- Python基础及异步编程
- Scrapy爬虫架构
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4c614b03357793393adb67abe374dc20.png)
大数据处理
大数据处理
- 大数据技术概述
- Spark设计及核心原理
- RDD编程应用
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/50dcc7f43a927b99ff48b38e83ce2deb.png)
自然语言处理
自然语言处理
- 自然语言处理概述
- 深度学习与反向传播
- Pytorch的使用
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/58d1f08ca9adaf34814cc943529d3207.png)
知识图谱
知识图谱
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b219fc1dafa6385ea8a00b1bdd5a1258.png)