- 博客(6)
- 收藏
- 关注
原创 基于最大子覆盖问题的文本摘要实验
基于最大子覆盖问题的文本摘要实验实验任务:从Web爬取某一主题的文本数据;对爬取到的文本库进行预处理,以提取关键词。预处理技术如:分词、去除停用词、stemming等;实现基于最大子覆盖问题的文本摘要算法,并从语料库中抽取100条摘要(集合元素可以是word或k-gram);实验报告中应说明摘要算法的性能,如执行时间、摘要的质量等。
2022-01-10 22:18:02 497
原创 web编程作业2
web编程作业2目的基于第一个项目爬虫爬取的数据,完成数据展示网站要求1、用户可注册登录网站,非注册用户不可登录查看数据2、用户注册、登录、查询等操作记入数据库中的日志3、爬虫数据查询结果列表支持分页和排序4、用Echarts或者D3实现3个以上的数据分析图表展示在网站中5、实现一个管理端界面,可以查看(查看用户的操作记录)和管理(停用启用)注册实验过程建表创建新表user和user_action,分别记录用户信息以及用户的登录查询操作1、以管理员身份运行cmd2、进入mysql
2021-07-07 21:37:27 146
原创 web编程作业
目录web编程作业爬虫爬取新浪网搜索网站web编程作业爬虫爬取新浪网基本思路:导入所需模块,定义要访问的网站,根据具体情况规定读取元素的方式和url,构造模仿浏览器的头,先读取种子页面,从中找出所有<a herf>链接,从而得到要爬取的具体页面,筛选后,爬取具体的新闻页面,并且将之保存到一个对象中,再把对象保存到数据库中。定义要访问的网站,并且指定解码方式var source_name = "新浪网";var myEncoding = "utf-8";var seedURL =
2021-04-28 23:52:57 242
原创 CSAPP:shell lab README实验指导书
介绍分配的目的是使您更加熟悉过程控制和信号通知的概念。为此,您需要编写一个简单的Unix Shell程序来支持作业控制。后勤您最多可以由两个人组成的小组来解决此分配问题。唯一的“ handin”将是电子的。对作业的任何澄清和修订都将发布在课程网页上。发放指示现场说明:在此处插入一段,说明教师如何将shlab-handout.tar文件分发给学生。这是我们在CMU使用的说明。首先将文件shlab-handout.tar复制到计划在其中进行工作的受保护目录(实验室目录)。然后执行以下操作:•键入命
2021-01-30 14:57:42 807
原创 C++读取txt文件失败的可能性
这里写自定义目录标题C++无法读入txt文件的可能性先给出正确格式:以下为可能的错误错误1:没有使用\\\错误2:文件名为中文C++无法读入txt文件的可能性编程环境: VSCode先给出正确格式:ifstream infile;infile.open(“F:\studyroom\students.txt”);以下为可能的错误错误1:没有使用\\只有1个\ifstream infile;infile.open(“F:\studyroom\students.txt”);写成了/if
2020-12-12 11:35:56 7898 1
原创 学生信息类
学生信息类编写一个学生成绩信息类,包含的数据有学号、姓名、程序设计课程成绩、计算机网络课程成绩、数据库课程成绩。输入若干名学生的成绩信息,显示3门课程总分从高到低的排名和每门课程成绩均大于85分的学生名单。运行结果示例样张如图1所示。注意:使用对象数组。#include <iostream>#include<cstring> using namespace std;class Score{private: int number; string name; in
2020-07-06 09:39:15 1459
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人