- 博客(8)
- 收藏
- 关注
原创 Linux操作系统分析学习总结
了解Linux的环境,讲了X86、ARM64汇编基础和指令乱序问题 通过Linux操作系统源代码分析了解Linux内核调试环境的搭建和启动过程 理解Linux操作系统分别在X86、ARM64上的的系统调用实现 熟悉Linux操作系统中进程的描述、创建、管理、调度和切换 理解Linux操作系统中对中断和异常的处理 掌握Linux文件系统,文件格式以及程序如何编译、链接和装载 掌握Linux操作系统中设备管理方法以及设备驱动。......
2022-07-05 21:55:51
192
1
原创 【创新实训】 后端开发记录(3):个性化推荐后台
需求 用户以此选择偏好电影的国家/地区、类别、主演,并根据用户的选择,推荐具有代表性的电影,用户选择喜好的电影后,将所选电影加入推荐系统,用来做后续的推荐。 models.py 使用movie和user的model class Movie(Document): movieId=IntField() source=DictField() name = StringField() nameFrn = StringField() directors = ListField(
2020-06-30 21:58:13
335
原创 【创新实训】 后端开发记录(2):电影详情后台
需求 RESTful API风格 GET 传入id 返回id对应的电影信息,该电影的相关评论,并将该电影加入用户的历史记录中 models.py 用了Movie,Comments,User三个model class Movie(Document): movieId=IntField() source=DictField() name = StringField() nameFrn = StringField() directors = ListField(String
2020-06-30 21:31:41
310
原创 【创新实训】 爬虫开发记录(3):爬取时光网详情页
爬取目标 爬取电影的name,nameFrn,year,cover,runtime,types,releaseDate,rating,rateNum,directors,writers,country,summary,stars 动态网页爬取 网页中的评分是通过ajax动态生成的,无法从网页源码中直接爬取 通过selenium和Chrome的webdriver可以模拟Chrome浏览器的访问来从动态生成网页上爬取数据 使用options配置webdriver使用无头的Chrome from seleni
2020-06-17 15:12:06
465
原创 【创新实训】 爬虫开发记录(2):爬取猫眼详情页
爬取目标 爬取电影的name,nameFrn,cover,types,country,runtime,releaseDate,year,summary,directors,stars,rating,rateNum 猫眼字体反爬 在电影详情页中,无法直接爬到评分和评分人数。 原因是在style中通过.woff文件对字体进行了加密,而且每次刷新网页,都会加载一个新的woff文件以及新的文字编码 将woff文件下载下来后,转为otf文件通过http://fontstore.baidu.com/stati
2020-06-14 18:05:17
528
原创 【创新实训】 后端开发记录(1):电影搜索后台
框架 后端采用Django编写 需求 /api/search GET params: name: 电影名筛选, rate_min: 最低评分,≥0筛去没有评分的电影,x.xx rate_max: 最高评分,为10即不限制,x.xx time_min: 最早上映时间, time_max: 最近上映时间, directors: 导演,仅支持单个,查询列表是否包含, stars: 演员,仅支持单个,查询列表是否包含, types:电影类型, writers:编剧,仅支持单个,查询列表是否包含, country:国
2020-06-10 23:50:41
448
原创 【创新实训】 爬虫开发记录(1):爬取豆瓣详情页
爬取目标 根据数据库中的豆瓣id,爬取豆瓣详情页,需要的信息是IMDb的id和该电影的简介和详情 包括source, sourceId, name, nameFrn,year,cover,directors,writers, stars, types, country,language, releaseDate, runtime, imdb, summary,rating, rateNum 使用的库 爬虫部分主要用python的requests_html库实现,使用fake_useragent库配置User
2020-06-10 23:33:46
705
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅