2018—2019学年第2学期
《大学计算机》课程报告
专业班级
学 号
姓 名
项 目
计算机基础测验
(20分)
课程报告
(80分)
总分
得 分
评阅教师
2019 年 6 月 15 日
说 明
本课程要求每个学生就感兴趣的某个领域数据进行获取、分析,并以可视化的方式将分析结果展示出来。因此,课程报告主要包括任务要求、数据获取、分析、可视化展示等数据处理过程的内容。
课程结束后,需要提交课程报告(电子及打印版)、相应数据文件和程序源代码。未提交相关资料者不能参加成绩评定。
课程报告要求参考本报告模板撰写,可根据具体情况适当调整,但文档结构要完整、格式排版美观、条理清晰、论述准确。
文档撰写不符合要求,或者抄袭他人作品,记零分。
第PAGE \* Arabic 5页
第 PAGE 1 页
(自己拟定题目)爱奇艺犯罪电影数据处理分析
正文
正文。5号宋体,1.1倍行距。
一、任务描述
(说明数据来源,获取什么样的数据,使用什么样的工具或方法,准备对数据如何处理分析,展示,达到什么样的结果或目标。)
使用python编写爬虫程序获取爱奇艺犯罪电影信息,内容包括…,并将获取数据保存到Excel文件中
使用excel工具对获取的电影信息进行数据处理,包括按照热度进行排序,分类、统计……等等
使用excel的图表工具对统计分析结果进行可视化,包括爱奇艺犯罪电影评分分段占比饼状图、…柱状图、…折线图、,……等等
二、数据获取
(描述数据的来源,获取哪些数据,获取数据的工具介绍、方法、步骤、存储等
可根据实际需要附加程序代码、图、表等)
1 数据描述
数据来源:爱奇艺犯罪电影URL链接以及想爬取的页面
数据获取:爱奇艺犯罪电影的(名称、时长、评分)并将获这些信息(名称、链接、时长、评分以及主演)写入Excel表格。
2 使用工具(或方法)
(对工具或方法的介绍)
python是一种功能丰富的语言,它拥有一个强大的基本类库和数量众多的第三方扩展。….
3 数据获取步骤
第一步:从网页上获取HTML内容。
第二步:分析网页内容并提取有用数据,采用二维列表存储影片所涉及的表单数据
第三步:将获得的数据写入Excel文件。
程序代码各式:5号等宽字体Courier New
程序代码各式:5号等宽字体Courier New,1.1倍行距。灰色背景(可选)
1) 获取数据代码如下
说明:这部分程序代码仅是格式示例,与题目内容无关import requests
说明:这部分程序代码仅是格式示例,与题目内容无关
import requests
from bs4 import BeautifulSoup
allUniv = [] #存储大学数据的二维列表
def getHtmlText(url): #获取网页内容
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = 'utf-8'
return r.text
except:
return ""
2) 将获得全部电影信息存储到Excel表格中,代码如下:
import requests
import requests
from bs4 import BeautifulSoup
allUniv = [] #存储大学数据的二维列表
……
5 数据保存到Excel文件,Excel文件截图如图1所示:
图1 电影数据的excel文件截图
正文中插图。
正文中插图。所有图要写明图号和图题,图号和图题应放在图位下方居中处,小5号宋体。图号与图题间空一格,图号从1开始编号,如“图1”,依次类推。
三、数据分析(文管类可以是数据存储、检索等等)
(描述数据分析的过程、方法:
可根据实际需要附加程序代码、图、表等)
表格要求:
表格要求:表格都要标明表号、表题,用小5号宋体字。表号和表题放在表格上方正中位置,表号后空一格书写表题。
表号从1开始编号,如“表1”,依次类推。
1 数据分析工具
Excel是一款电子表格软件。直观的界面、出色的计算功能和图表工具,使Excel成为最流行的个人计算机数据处理软件。Excel具有强大的数据统计分析处理能力,能进行多种数据统计计算分析功能,广泛应用于管理、统计财经、金融等众多领域。
2 使用excel工具以评分为主进行爱奇艺犯罪电影热度排名分析最受欢迎的电影
方法步骤:
……
电影热度排名后的结果如图2:
图2 电