工作周报（20190928-20191004）

最新推荐文章于 2022-03-13 22:03:26 发布

PeikLong

最新推荐文章于 2022-03-13 22:03:26 发布

阅读量147

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39591838/article/details/102093765

版权

本周工作报告：

上周的计划由于国庆假期，代码部分已完成，但论文阅读进展不大，所以没有更新论文阅读记录，完成的工作如下：

1、按照python参考书内容编写了新闻爬虫，爬取了上海对外经贸大学新闻网的新闻，保存了相关新闻的标题、时间、内容等信息，并可对保存的信息进行进一步查询，同时对python数据结构有了进一步了解，遇到的相关问题附上记录链接。

代码见GitHub中，名为代码文件夹下的CrawlNews_example.ipynb（需要jupyter notebook打开运行）

2、按照上述爬虫示例代码编写了书籍信息爬虫，针对网易云阅读网站爬取了书籍相关的书名、作者、价格及评分等相关内容。

代码见GitHub中，名为代码文件夹下的CrawlNews_week2.ipynb

GitHub地址：https://github.com/Peiklong/DIPRE.git

问题记录及代码地址：

更改jupyter默认工作路径：https://blog.csdn.net/qq_39591838/article/details/102095026

python中的三个基本数据类型：https://blog.csdn.net/qq_39591838/article/details/102095677

python中__name__的使用：https://blog.csdn.net/qq_39591838/article/details/102096030

Github代码地址：https://github.com/Peiklong/DIPRE.git

下周工作计划：

1、继续阅读未完成的论文部分，并做好论文阅读记录。

2、尝试将爬取的书籍或新闻的相关信息存成csv文件或存入mysql数据库。

PS：根据现有的进展，预计完成该任务的时间在10月25日

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

PeikLong CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

31万+: 周排名

67万+: 总排名

6万+: 访问

: 等级

825: 积分

37: 粉丝

43: 获赞

14: 评论

146: 收藏

私信

关注

最新评论

主观题自动评阅实现—week2
小源1108: 没有找到欸
主观题自动评阅实现—week2
求心不求佛: 请问你找到了吗？我也在找，交流下
主观题自动评阅实现—week2
小源1108: 你好我想请问你有没有这种简答题学生答案，标准答案，最终得分的数据集呀？
主观题自动评阅实现—week2
vivisol: 这个好像也没有办法判断“肯否问题”，只判断语义相似性的话，它会认为原命题和否命题是等价的，
DIPRE论文阅读记录——参考说明
LAWKAWAI: 终于明白了为什么要取前缀中的最长匹配后缀作为pattern的前缀了，太赞了

大家在看

Visual Studio代码编辑快捷键

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。