- 博客(6)
- 收藏
- 关注
原创 新闻爬虫数据展示网站实现
1. 实验内容 基于第一个项目爬虫爬取的数据,完成数据展示网站。 基本要求: 用户可注册登录网站,非注册用户不可登录查看数据 用户注册、登录、查询等操作记入数据库中的日志 爬虫数据查询结果列表支持分页和排序 用Echarts或者D3实现3个以上的数据分析图表展示在网站中 实现一个管理端界面,可以查看(查看用户的操作记录)和管理(停用启用)注册用户。 扩展要求(非必须): 实现对爬虫数据中文分词的查询 实现查询结果按照主题词打分的排序 用Elastic Search+Kibana展示爬虫的数据结果 2
2021-06-21 21:51:18 380 2
原创 新闻爬虫及查询网站的实现(五):前端设计及总结
上文: 新闻爬虫及查询网站的实现(〇):实验任务与内容介绍 新闻爬虫及查询网站的实现(一):爬虫基本框架的实现 新闻爬虫及查询网站的实现(二):具体网站具体解析 新闻爬虫及查询网站的实现(三):数据库交互操作 新闻爬虫及查询网站的实现(四):新闻检索 1. 实验内容 完成最少一个目标网站的分析和爬虫设计; 爬取不少于100条数据(每条数据包括最少3个字段,标题、内容和时间),并存储在数据库中; 完成对数据库中爬取数据内容或标题的搜索功能,搜索结果以表格形式展示在前端页面中; 完成对搜索内容的时间热度分析。
2021-04-30 05:51:28 503
原创 新闻爬虫及查询网站的实现(四):新闻检索
上文: 新闻爬虫及查询网站的实现(〇):实验任务与内容介绍 新闻爬虫及查询网站的实现(一):爬虫基本框架的实现 新闻爬虫及查询网站的实现(二):具体网站具体解析 新闻爬虫及查询网站的实现(三):数据库交互操作 1. 实验内容 完成最少一个目标网站的分析和爬虫设计; 爬取不少于100条数据(每条数据包括最少3个字段,标题、内容和时间),并存储在数据库中; 完成对数据库中爬取数据内容或标题的搜索功能,搜索结果以表格形式展示在前端页面中; 完成对搜索内容的时间热度分析。 2. 实验任务 爬取数据。 数据库交
2021-04-29 21:35:12 421
原创 新闻爬虫及查询网站的实现(三):数据库交互操作
上文: 新闻爬虫及查询网站的实现(〇):实验任务与内容介绍 新闻爬虫及查询网站的实现(一):爬虫基本框架的实现 新闻爬虫及查询网站的实现(二):具体网站具体解析 1. 实验内容 完成最少一个目标网站的分析和爬虫设计; 爬取不少于100条数据(每条数据包括最少3个字段,标题、内容和时间),并存储在数据库中; 完成对数据库中爬取数据内容或标题的搜索功能,搜索结果以表格形式展示在前端页面中; 完成对搜索内容的时间热度分析。 2. 实验任务 爬取数据。 数据库交互: 创建并连接数据库; 实现主要操作的函数的
2021-04-29 10:23:51 290
原创 新闻爬虫及查询网站的实现(一):爬虫基本框架的实现
上文: 新闻爬虫及查询网站的实现(〇):实验任务与内容介绍 1. 实验内容 完成最少一个目标网站的分析和爬虫设计; 爬取不少于100条数据(每条数据包括最少3个字段,标题、内容和时间),并存储在数据库中; 完成对数据库中爬取数据内容或标题的搜索功能,搜索结果以表格形式展示在前端页面中; 完成对搜索内容的时间热度分析。 2. 实验任务 爬取数据: 利用Nodejs,实现爬虫的基本通用框架; 利用正则表达式,对要爬取的网站进行解析; 得到结构化的数据。 数据库交互。 新闻检索。 前端设计。 3.
2021-04-28 15:20:55 282
原创 新闻爬虫及查询网站的实现(〇):实验任务与内容介绍
新闻爬虫及查询网站的实现(〇):任务与内容介绍 显然,这并不是我自己想写的东西,所以这一看就是一个实验报告;实际上这就是一个实验报告,所以怎么看都是实验报告!希望我不要忘了删掉这一段! 1. 实验内容 完成最少一个目标网站(网站主题不限,不允许直接使用示例中的中国新闻网)的分析和爬虫设计; 爬取不少于100条数据(每条数据包括最少3个字段,标题、内容和时间),并存储在数据库中; 完成对数据库中爬取数据内容或标题的搜索功能,搜索结果以表格形式展示在前端页面中; 完成对搜索内容的时间热度分析,比如搜索“新冠”
2021-04-27 23:49:14 209
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人