自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 软件工程复习笔记——第八章UML统一建模语言

第八章 UML统一建模语言8.1 概述UML(Unified Modeling Language)是软件界第一个统一的建模语言,该方法结合了Booch, OMT, 和OOSE方法的优点,统一了符号体系,并从其它的方法和工程实践中吸收了许多经过实际检验的概念和技术。UML是一种标准表示,是一种基于面向对象的可视化的通用(General)建模语言。提供统一的交流标准——UML图。面向对象建模的基本概念1.什么是模型?模型是对系统的完整的抽象表示,建模是在不同层次上对系统的描述。开发一个计算机

2021-12-10 22:09:39 1387

原创 软件工程复习笔记——第七章 面向对象的设计方法

第七章 面向对象的设计方法7.1 面向对象的基本概念面向对象的概念和应用已超越了程序设计和软件开发,扩展到如数据库系统,交互式界面,分布式系统,网络管理结构和人工智能等领域。面向对象的技术已成为软件开发的一种新方法,新技术。7.1.1 什么是面向对象的开发方法面向对象的开发方法——OOSD法是一种把面向对象的思想应用于软件开发过程,指导开发活动的系统方法。问题空间——软件系统所涉及到的应用领域和业务范围(现实世界)。解空间——用于解决某些问题的软件系统。一、软件开发过程二、传统软件

2021-12-10 21:31:38 8304

原创 软件工程复习笔记——第六章 软件维护

第六章 软件维护6.1 软件维护的类型软件维护是指软件系统交付使用以后,为了改正错误或满足新的需求而修改软件的过程。一、软件维护的分类按照不同的维护目的,维护工作可分为4类:完善性维护50%:扩充原有系统的功能,提高性能,满足用户的实际需要纠错性维护25%:对测试阶段未暴露的问题进行即使的修改等适应性维护21%:使运行的软件能适应运行环境的变动而修改软件的过程预防性维护4%:为进一步改善软件的可靠性和易维护性,为未来的维护打下基础而进行的修改二、维护的步骤三、维护工作的组织管理

2021-12-10 21:04:26 2027

原创 软件工程复习笔记——第五章 软件测试

第五章 软件测试5.1 软件测试的基本概念一、软件测试的目的和重要性因为开发工作的前期不可避免地会引入错误,测试的目的是为了发现和改正错误,这对于某些涉及人的生命安全或重要的军事、经济目标的项目显得尤其重要。二、软件测试的特点1.软件测试的开销大按照Boehm的统计,软件测试的开销大约占总成本的30%-50%。2.不能进行“穷举”测试只有将所有可能的情况都测试到,才有可能检查出所有的错误。但这是不可能的。3.软件测试难度大要尽可能找出多的错误,软件测试工作就需要选择“高效的

2021-12-10 21:01:26 1781 1

原创 软件工程复习笔记——第四章 程序设计语言与编码

第四章 程序设计语言与编码程序编码阶段的任务:为每个模块编写程序,将详细设计的结果转换为源程序代码。从如何提高软件的质量和可维护性的角度,讨论在编码阶段所要解决的主要问题程序设计语言的特性及选择的原则程序设计风格软件设计风格4.1 程序设计语言的选择一、程序设计语言的分类低级语言:机器语言和汇编语言表示成二进制形式的机器基本指令集,依赖于特定的机器,复杂繁琐且易出错高级语言:比低级语言更接近于待解的问题,易学易用易维护,提高软件生产效率按应用范围分:通用语言:PASC

2021-12-10 20:30:43 606

原创 软件工程复习笔记——第三章 软件设计基础

第三章 软件设计基础3.1 软件设计概述软件设计阶段要解决“如何做”的问题一、软件设计阶段得到任务与目标设计任务:将需求阶段获得的需求说明(模型)转换为计算机中可实现的系统。软件设计任务涉及多方面,可分为总体设计和详细设计。软件设计的目标就是构造一个高内聚低耦合的软件模型。主要任务:软件体系结构的设计数据结构的设计用户界面的设计算法的设计3.1.1 软件体系结构设计软件体系结构确定了系统的组织结构和拓扑结构,显示了系统需求和构成系统的元素之间的对应关系,提供了一

2021-12-10 20:27:42 964

原创 虚假新闻识别检测分类

在这个社交媒体和互联网的世界中,我们接触到各种新闻和文章,但其中一些新闻和文章是假的,是为了好玩或出于恶意而制作的,这对社会是非常有害的。想对媒体产生的新闻进行鉴别,实现对虚假新闻和真实新闻的检测分类识别,以便用户对获取到的新闻进行清晰的认知,排除虚假新闻对用户的影响。

2021-12-04 12:27:52 3807

原创 软件工程复习笔记——第二章 需求分析基础

第二章 需求分析基础2.1 软件需求工程的基本概念对系统应该提供的服务和所受到的约束进行理解、分析、建立文档、检验的过程——需求工程没有需求就没有软件。软件需求的困难:应用领域的广泛性非功能需求建模技术的缺乏沟通上的困难软件需求的内容:功能需求: 是对系统应该提供的服务、功能以及系统特定条件下的行为的描述。领域需求: 是由软件系统的应用领域所决定的特有的功能需求,或是对功能的约束。非功能需求:传统需求分析的作用:定义软件的范围及必须

2021-11-22 23:22:22 483

原创 软件工程复习笔记——第一章 软件工程导言

第一章 软件工程导言一、软件技术(一)软件与软件工程软件 是客观世界中问题空间与解空间的 具体描述​ 追求 表达能力强、更符合人类思维模式​ 具有构造性和易演化性的计算模型工程 是综合应用 科学理论和技术手段改造 客观世界的 具体实践活动以及 取得的实际成果软件工程 应用 计算机科学理论和技术 以及工程管理原则和方法 按预算和进度实现 满足用户要求的软件产品的定义、开发、发布和维护的工程或以之为研究对象的学科 (计算机大百科全书)

2021-11-22 23:13:27 269

原创 数据挖掘复习笔记第八章——回归

第八章 回归8.1 回归概述回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。x:自变量 y:因变量 确定y随x的变化情况按因变量的多少:简单回归分析和多重回归分析涉及自变量的多少:一元回归和多元回归分析按自变量和因变量的关系类型:线性回归分析和非线性回归分析8.2 应用案例8.3 线性回归一元线性回归多元线性回归多项式回归m(x)=β0+β1x1+β2x22+⋯+βdxdd=β0+∑k=1

2021-11-03 00:11:51 323

原创 数据挖掘复习笔记第七章——聚类

第七章 聚类7.1 聚类分析聚类分析(Cluster analysis),简称聚类(Clustering),是一个把数据对象划分为子集的过程。簇(Cluster):每一个子集是一个簇簇内对象相似,簇间对象相异最小化类内距离,最大化类间距离聚类是一种无监督学习好的聚类分析方法会产生高质量的聚类高类内相似度,低类间相似度聚类方法中主要的因素是距离或相似度聚类分析的数据挖掘功能作为一个独立的工具来获得数据分布的情况作为其他算法(如:特征和分类)的预处理步骤聚类分析的数

2021-11-03 00:11:39 1452

原创 数据挖掘复习笔记第六章——分类

第六章 分类6.1 分类、回归与聚类分类和回归是两种数据分析形式,用于提取描述重要数据类或预测未来的数据趋势的模型。分类:预测类对象的分类标号(离散值)回归:建立连续函数值模型6.2 分类的应用案例6.3 分类概念分类过程测试集要独立于训练样本集,否则会出现“过分拟合”(overfitting)的情况6.4 常用的分类方法6.4.1 K-近邻给定一个未知样本,k-最近邻分类法搜索模式空间,找出最接近未知样本的k个训练样本;然后使用k个最临近者中最公共的类来预测当前样本

2021-11-03 00:11:30 815

原创 数据挖掘复习笔记第五章——关联规则

第五章 关联规则5.1概述频繁模式是频繁地出现在数据集中的模式。目的:发现数据中蕴含的内在规律。经典的关联规则挖掘算法Apriori算法FP-growth算法5.2 基本概念5.2.1 项目和项集定义:设I={$i_1 ,i_2 , … ,i_m KaTeX parse error: Expected 'EOF', got '}' at position 1: }̲是m个不同项目的集合,每个i_k (k=1,2,\cdots,m)称为一个项目() 称为一个项目()称为一个项

2021-11-03 00:11:20 804 1

原创 数据挖掘复习笔记第四章——数据仓库

第四章 数据仓库4.1 数据仓库4.1.1 数据仓库的定义数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理者的决策过程。主要进行分析决策,不太关注数据的操作4.1.2 数据仓库和数据库的关系数据仓库是从历史的角度提供信息,而数据库保存当前数据。数据仓库中的数据时间期限要远远长于操作型数据库中的 数据时间期限。演变过程:关系数据库→\rightarrow→高级数据库→\rightarrow→数据仓库技术和数据挖掘技术数据库的局限性:传统数据库所能做到的只是对已有的数据

2021-11-03 00:11:09 334

原创 数据挖掘复习笔记第三章——数据预处理

第三章 数据预处理3.1 数据预处理:概述​ 数据有可能是有缺失、不一致、有噪声、高维数据质量:保证完整性 一致性 有噪声 准确性 时效性 可信性 可解释性数据预处理的主要工作:抓取/抽取工作:从不同的网络、平台、 数据库、数据格式、 应用中抽取数据。清洗:空缺、噪声数据处理等集成数据:合并、汇总、过滤等降维:将高维数据降低到低维空间中转换:重新格式化和转换质量差→\rightarrow→数据清洗→\rightarrow→质量可控来源多样化→\righta

2021-11-03 00:11:00 1975

原创 数据挖掘复习笔记第二章——认识数据

第二章 认识数据2.1 数据对象与属性类型数据集由数据对象组成。一个数据对象代表一个实体。 数据库中行对应数据对象,列对应于属性。数据属性标称属性标称属性的值是事物的标号或者名称。每一个值表示一个类别、编码或者状态。值没有次序。只能进行= ≠运算二元属性只有两个类别或者状态(0或1)二元属性是标称属性的特例对称的二元属性 权重相同非对称的二元属性 状态结果不是同样的重要只能进行= ≠运算序数属性可能的值之间具有有意义的序或秩评定(ranking)

2021-11-03 00:09:53 847

原创 数据挖掘复习笔记第一章——概述

第一章 概述1.1 背景数据爆炸性增长数据的收集和数据的可获得性数据挖掘:海量数据的自动分析技术1.2 基本概念1.2.1 数据数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。数据可能存储在数据库、数据仓库和其他信息资料库中。类型连续型:数值离散型:标称 二元符号 字符存在问题:不一致 错误 缺失1.2.2 信息信息是具有时效性的,有一定含义的,有逻辑的、经过加工处理

2021-11-02 11:38:05 696

虚假新闻检测分类代码fake news.py

虚假新闻检测分类代码

2021-12-04

虚假新闻识别检测数据集news.csv

虚假新闻识别检测数据集news.csv

2021-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除