- 课程设计内容要求
任务一:基础应用
- 实现一个学生类,包括学号,姓名,性别,年龄,籍贯等基本信息。
- 开发一个系统,能够输入n个学生的基本信息,并保存在文件中;能够查询、修改、删除学生信息;
- 实现一个排序算法,能够对n个学生进行排序输出
任务二:案例应用---女生身高数据的回归分析
任务要求:
- 根据过程说明,实现女性数据的处理、分析、预测与作图
- 上述过程说明使用的是线性回归,现在使用多项式回归:y=ax^2+bx+c
提示1:构造输入加入列的方式
x_1=np.ones((X.size,1))
X_add_1_2=np.column_stack((x_1,X,np.power(X,2)))
提示2:模型拟合
import statsmodels.api as sm
m=sm.OLS(Y,X_add_1_2)
r=m.fit()
任务三:案例应用---中国大学排行榜分析
1.网络爬虫实现原理:
(1)Requests爬取数据原理和实例
Python——爬虫【Requests设置请求头Headers】_syblogs的博客-CSDN博客_requests headers
(2)BeautifulSoap的使用
Beautiful Soup 中文文档:
https://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html
Beautiful Soup 中文文档:
https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
- 任务要求:
(1)基础任务:分析并实现类似于课件中的淘宝和京东商品信息的数据爬取
https://www.shanghairanking.cn/rankings,爬取排行榜数据,分析按区域的大学数量排行,得出有效结论。
- 爬取主榜数据并保存在文件中
- 分析每个地区上榜大学的数量,保存在文件中
- 分析前十名的地区的大学数量,绘制柱状图
- 分析医药类大学情况,得出有效结论
- 文档要求
根据上述两点完成文档,主要内容包括:
- 任务要求
- Requests爬取数据原理
- BeautifulSoap的原理
- 中国大学排行分析
任务四:爬取百度百科中《乘风破浪的姐姐》所有选手信息,并进行可视化分析。
数据获取来源:https://baike.baidu.com/item/乘风破浪的姐姐
详细代码以及文档请后台私信我或+ FodderFish