自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 高软学习总结

软件工程

2022-07-09 20:27:23 135 1

原创 Linux操作系统分析学习总结

了解Linux的环境,讲了X86、ARM64汇编基础和指令乱序问题通过Linux操作系统源代码分析了解Linux内核调试环境的搭建和启动过程理解Linux操作系统分别在X86、ARM64上的的系统调用实现熟悉Linux操作系统中进程的描述、创建、管理、调度和切换理解Linux操作系统中对中断和异常的处理掌握Linux文件系统,文件格式以及程序如何编译、链接和装载掌握Linux操作系统中设备管理方法以及设备驱动。......

2022-07-05 21:55:51 137 1

原创 【创新实训】 后端开发记录(3):个性化推荐后台

需求用户以此选择偏好电影的国家/地区、类别、主演,并根据用户的选择,推荐具有代表性的电影,用户选择喜好的电影后,将所选电影加入推荐系统,用来做后续的推荐。models.py使用movie和user的modelclass Movie(Document): movieId=IntField() source=DictField() name = StringField() nameFrn = StringField() directors = ListField(

2020-06-30 21:58:13 257

原创 【创新实训】 后端开发记录(2):电影详情后台

需求RESTful API风格GET 传入id返回id对应的电影信息,该电影的相关评论,并将该电影加入用户的历史记录中models.py用了Movie,Comments,User三个modelclass Movie(Document): movieId=IntField() source=DictField() name = StringField() nameFrn = StringField() directors = ListField(String

2020-06-30 21:31:41 257

原创 【创新实训】 爬虫开发记录(3):爬取时光网详情页

爬取目标爬取电影的name,nameFrn,year,cover,runtime,types,releaseDate,rating,rateNum,directors,writers,country,summary,stars动态网页爬取网页中的评分是通过ajax动态生成的,无法从网页源码中直接爬取通过selenium和Chrome的webdriver可以模拟Chrome浏览器的访问来从动态生成网页上爬取数据使用options配置webdriver使用无头的Chromefrom seleni

2020-06-17 15:12:06 352

原创 【创新实训】 爬虫开发记录(2):爬取猫眼详情页

爬取目标爬取电影的name,nameFrn,cover,types,country,runtime,releaseDate,year,summary,directors,stars,rating,rateNum猫眼字体反爬在电影详情页中,无法直接爬到评分和评分人数。原因是在style中通过.woff文件对字体进行了加密,而且每次刷新网页,都会加载一个新的woff文件以及新的文字编码将woff文件下载下来后,转为otf文件通过http://fontstore.baidu.com/stati

2020-06-14 18:05:17 419

原创 【创新实训】 后端开发记录(1):电影搜索后台

框架后端采用Django编写需求/api/searchGET params:name: 电影名筛选,rate_min: 最低评分,≥0筛去没有评分的电影,x.xxrate_max: 最高评分,为10即不限制,x.xxtime_min: 最早上映时间,time_max: 最近上映时间,directors: 导演,仅支持单个,查询列表是否包含,stars: 演员,仅支持单个,查询列表是否包含,types:电影类型,writers:编剧,仅支持单个,查询列表是否包含,country:国

2020-06-10 23:50:41 338

原创 【创新实训】 爬虫开发记录(1):爬取豆瓣详情页

爬取目标根据数据库中的豆瓣id,爬取豆瓣详情页,需要的信息是IMDb的id和该电影的简介和详情包括source, sourceId, name, nameFrn,year,cover,directors,writers, stars, types, country,language, releaseDate, runtime, imdb, summary,rating, rateNum使用的库爬虫部分主要用python的requests_html库实现,使用fake_useragent库配置User

2020-06-10 23:33:46 605

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除