作业一:准备 作业二:分布式版本控制系统Git的安装与使用 作业三:了解大数据的特点、来源与数据呈现方式 作业四:字符串、文件操作,英文词频统计预处理 作业五:复合数据类型,英文词频统计 作业六:中文词频统计 作业七:理解爬虫原理 作业八:获取一篇新闻的全部信息 作业九:爬取全部的校园新闻 作业十:爬虫综合大作业 作业十一:安装关系型数据库MySQL 作业十二:分布式文件系统HDFS练习 大数据应用期末总评Hadoop综合大作业 转载于:https://www.cnblogs.com/wuguoliang/p/11061926.html