自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 【自然语言处理】补充:文本分类及朴素贝叶斯分类器

多元贝努利模型,它等价于二值独立模型,对于词汇表中的每个词项都对应一个二值变量,1和0分别表示词项在文档中出现和不出现。例如:对于UK类别中的一篇文档,在第一个位置上生成QUEEN的概率和在最后一个位置上生成它的概率一样。贝努利模型只考虑词项的出现或不出现(即二值),并不考虑出现的次数,而多项式模型则要考虑出现次数。以该类为条件,(在各自位置上)基于概率P(tk|c)产生每个词语,这些词语之间相互独立。但是,训练集的规模总是有限的。上式中存在过多的参数,每个参数都是一个类别和一个词语序列的组合。

2024-09-27 17:16:42 1020

原创 【自然语言处理】补充:词项权重计算及向量空间模型

除词项频率tf外,我们还想利用词项在整个文档集中的频率进行权重和评分计算。

2024-09-21 16:59:01 739

原创 【自然语言处理】补充:布尔模型

假定词汇表的大小(即词项个数)=500K,词项-文档矩阵将非常大,矩阵大小为500K*1M=500G。但是该矩阵中最多有10亿(1G)个1,此时矩阵高度稀疏(1G/500G=0.2%),应该有更好的表示方法(比如仅仅记录所有1的位置):假定N=一百万篇文档(1M),每篇有1000个词(1K),每个词平均有6个字节(包括空格和标点符号),那么所有文档将约占(1M。是指利用AND,OR或者NOT操作符将词项连接起来的查询,例如:信息AND检索、信息OR检索、信息AND检索AND NOT教材。

2024-09-20 12:32:01 661

原创 【软件工程】第三章软件工程模型和方法

什么是面向对象方法面向对象方法的优势反映单一范式Reflects a single paradigm促进架构和代码重用Facilitates architectural and code reuse更紧密地反应现实世界模型Reflects real world models more closely鼓励稳定性Encourages stability适应变化Is adaptive to change发展历史用途Middleware。

2024-09-18 16:43:14 1319

原创 【自然语言处理】第二章现代语言学基础

从语言使用时的外部环境来看句子在交际中实际传递的信息、发挥的功能,就是调用语用系统对句子的语义做出更全面的解释。语用系统的本质是基于经验的逻辑推理。

2024-09-07 21:01:55 1338

原创 【自然语言处理】第一章绪论

自然语言通常指人类的语言是人类的思维和逻辑的载体是人类智能的外在表现形式之一对自然语言的研究是人工智能的重要研究内容使计算机理解人类的语言,能够让计算机以自然语言作为接口与人类进行交互从事NLP相关工作的研究人员通常具备计算机科学与技术相关的背景知识,能够从计算机科学与技术的角度看待NLP问题他们更加关注NLP问题的可计算性,算法效率的优化以及相关应用等方面的问题。

2024-09-07 19:14:32 777

原创 【软件工程】第二讲软件过程

人:完成软件开发的主体技术:提供了建造软件在技术上需要“如何做”的方法管理:提供了质量管理、成本管理、时间管理、范围管理等知识和技能过程:这是将人、技术、管理结合在一起的凝聚力;过程是产品成本、进度和质量的主要决定因素。

2024-09-04 18:02:01 1105

原创 【软件工程】第一章软件工程引论

平台和应用是软件发展的外在驱动力工程是对技术(或社会)实体的分析、设计、建造、验证和管理。工程是一种组织良好、管理严密、各类人员协同配合、共同完成工作的学科。它具有以下特征:以价值为目标高度的组织管理性多种学科的综合高度的实践性1968年,NATO会议上首次提出了“软件工程”的概念,标志着软件开发开始转向工程化。软将工程就是为了经济地获得可靠的且能在实际机器上高效运行的软件而建立和使用的工程原理。

2024-09-04 17:56:32 1028

原创 【Linux与嵌入式系统】第一讲嵌入式系统基础

概念:实时系统是指产生系统输入的时间对系统至关重要的系统。从输入到输出的滞后时间必须足够小到一个可接受的时限内。因此,实时逻辑的正确性不仅依赖于计算结果的正确性,还取决于输出结果的时间。实时系统是一个能够在指定或者确定的时间内完成系统功能以及对外部或内部事件在同步或异步时间内做出响应的系统。逻辑正确性:产生正确的输出时间正确性:在恰当的时间或时限之前产生输出失败所需付的代价可预测性。

2024-09-03 18:02:15 3138

原创 【Linux与嵌入式系统】第一讲习题

【Linux与嵌入式系统】第一讲习题请给出你对嵌入式系统的理解,并通过两个典型的嵌入式系统产品说明嵌入式系统的基本结构和特点。与嵌入式系统关系密切的技术学科有哪些?写出下列英文缩写的英文原文及中文含义。MPUMCUH/WS/WAIRAMROMEPROMEEPROMRTOSSOCSOPCIPAPIOSHALBSPMIPSIrDASPIUARTPCMCIAMMUIDEOCDICDBDMICEIIS简述什么是嵌入式系统试通过比较嵌入式系统

2024-09-03 17:55:45 1241

原创 算法分析与设计_3_分治

分治法:对于一个规模为n的问题:若该问题可以容易地解决(比如说规模n较小)则直接解决,否则将其分解为k个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解分治法所能解决的问题的特征该问题的规模缩小到一定的程度就可以容易地解决该问题可以分解为若干个规模较小的相同问题利用该问题分解出的子问题的解可以合并为该问题的解该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子问题。

2024-06-04 09:26:31 968 1

原创 算法分析与设计_2_递归算法设计技术

在定义一个过程或函数时出现调用本过程或本函数的成分,称之为递归。若调用自身,称之为直接递归;若过程或函数p调用过程或函数q,而q又调用p,称之为间接递归。任何间接递归都可以等价地转换为直接递归。如果一个递归过程或递归函数中递归调用语句是最后一条执行语句,则称这种递归调用为尾递归。需要解决的问题可以转化为一个或多个子问题来求解,而这些子问题的求解方法与原问题完全相同,只是在数量规模上不同递归调用的次数必须是有限的必须有结束递归的条件来终止递归示例:设计求n!(n为正整数)的递归算法。

2024-05-30 20:20:49 1106

原创 算法分析与设计_1_概述

算法:是求解问题的一系列计算步骤,用来将输入数据转换为输出结果;如果一个算法对其每一个输入实例,都能输出正确的结果并停止,那么称它是正确的算法设计应满足的目标正确性可使用性可读性健壮性高效率与低存储量需求算法具有的重要特征有限性确定性可行性输入性输出性。

2024-05-30 14:36:21 803

原创 操作系统6_输入输出系统

当一个进程请求I/O操作时,该进程将被挂起,直到I/O操作完成后,设备控制器便向CPU发送一个中断请求,CPU响应后便转向中断处理程序去执行,中断处理程序执行相应的请求处理,处理完后解除相应进程的阻塞状态。:虽然在CPU和I/O设备之间增加了设备控制器后,已能大大减少CPU对I/O的干预,但当主机所配置的外设很多时,CPU的负担仍然很重,为此,在CPU和设备控制器之间又增设了I/O通道。:DMA方式较之中断驱动方式,又是成百倍地减少了CPU对I/O的干预,进一步提高了CPU与I/O设备的并行操作程度。

2024-05-30 08:29:47 891

原创 操作系统4+5_内存管理测试题

指将内存中暂时不能运行的进程或者暂时不用的程序和数据转移到外存上,以腾出足够的内存空间;或者将已经具备运行条件的进程或进程所需要的程序和数据从外存调入内存,以便执行。指在程序执行的过程中,每次访问内存之前将程序的逻辑地址翻译成物理地址,使得程序可以访问到实际的物理内存。是指程序运行前将各个目标模块及其所需的库函数链接成一个完整的装入模块,以后不再拆开。,是指具有请求调入功能和置换功能、能从逻辑上对内存容量加以扩充的一种存储器系统。把用户程序装入内存时对有关指令的地址部分的修改定义为。

2024-05-28 14:08:05 1015

原创 操作系统5_虚拟存储器

假定系统为某进程分配了三个物理块,并考虑有以下的页面号引用串:7、0、1、2、0、3、0、4、2、3、0、3、2、1、2、0、1、7、0、1。:假定系统为某进程分配了三个物理块,并考虑有以下的页面号引用串:7、0、1、2、0、3、0、4、2、3、0、3、2、1、2、0、1、7、0、1。:假定系统为某进程分配了三个物理块,并考虑有以下的页面号引用串:7、0、1、2、0、3、0、4、2、3、0、3、2、1、2、0、1、7、0、1。当所访问的段不在内存中时,可请求操作系统将所缺的段调入内存。

2024-05-28 11:05:42 1077

原创 操作系统4_存储器管理

用可变分区(动态重定位)方式管理主存时,假定主存中按地址顺序依次有5个空闲区,空闲区的大小依次为32K、10K、5K、228K、100K,现有5个作业A、B、C、D、E。它们各需主存1K、10K、108K、28K、115K,若采用最先适应算法能把这5个作业按顺序全部装入主存吗?:预先不对内存启用区进行分区,整个内存用户区是一个连续的大空闲分区;有作业序列:作业A要求18K,作业B要求25K,作业C要求30K。经分析可知,最佳适应法对这个作业序列是合适的,而其他两种对该作业序列是不合适的。

2024-05-28 08:29:36 1133

原创 操作系统3_作业与处理机调度测试题

一组并发进程中,每个进程都无限等待该组进程中其他进程所占有的资源,因而永远无法得到该资源并继续执行的一种僵局,这种现象称为进程死锁,参与死锁的进程就称为死锁进程。在计算机系统中,临界资源是指在多线程或多进程环境下,多个线程或进程需要访问的共享资源,这些资源在某一时间段内只允许一个进程访问,也称独占资源。用户角度:在一次应用业务处理过程中,从输入开始到输出结束,用户要求计算机所做的有关该次业务处理的全部工作称为一个作业。带权周转时间,指作业的周转时间T与系统为它提供服务的时间Ts之比。什么是带权周转时间?

2024-05-24 17:56:46 470

原创 操作系统3_作业与处理机调度

如上案例,短作业C的带权周转时间高达100,不能容忍,而长作业D的带权周转时间仅为1.99;FCFS算法有利于CPU繁忙型的作业,不利于I/O繁忙型作业,同时也有利于长作业,不利于短作业。

2024-05-24 16:25:09 1139

原创 操作系统1_操作系统概述测试题

通过通信网络将物理上分布的具有自治功能的数据处理系统或计算机系统互连起来,实现信息交换、资源共享、协作完成任务的计算机系统。指系统及时(或即时)响应外部事件的请求,在规定的时间内完成对该事件的处理,并控制所有实时任务协调一致地运行。操作系统是一组控制和管理计算机硬件和软件资源,合理地对各类作业进行调度,以方便用户使用的程序的集合。在应用程序执行前,将相关的信息或数据预先输入到辅助存储设备上。只有被一个使用者释放后才能被另一个申请者使用。分布式操作系统的概念。

2024-05-21 18:00:39 491

原创 操作系统2_进程管理测试题

进程上下文是进程执行活动全过程的静态描述,包括:进程的用户地址空间内容、处理器中寄存器内容、该进程相关的核心数据结构。直接制约是一组在异步环境下的并发进程,各自的执行结果互为对方的执行条件,从而限制各进程的执行速度的过程。进程同步是指一组并发进程由于相互合作,共同完成某种任务,因而相互等待,使得各进程按一定的速度执行的过程。临界区是每个进程中访问临界资源的那段程序代码。

2024-05-21 17:10:40 423

原创 操作系统2_进程管理

一组相关的数据结构和过程一并称为管程;一个管程定义了一个数据结构和能为并发进程在该数据结构上所执行的一组操作,这组操作能同步进程和改善管程中的数据管程的组成局部于管程的共享变量说明对该数据结构进行操作的一组过程对局部于管程的数据设置初始值的语句管程的语法variable declarations // 声明局部变量// 过程P1// 过程P2...// 过程Pnbegin// 初始化语句end管程的操作说明管程中的数据结构只能由管程中的过程访问,其它过程不能访问。

2024-05-21 16:12:21 1283

原创 matlab使用2-基础绘图

选择哪种方法取决于具体需求,例如想要创建的子图的数量、位置、样式以及是否需要与其他MATLAB功能(如工具栏、菜单等)集成等等。函数允许更精细地控制子图的位置和大小,可以通过指定位置向量和轴属性来定义轴的范围和样式。函数用于在单个图形窗口中创建多个子图。你可以指定子图的网格位置和当前激活的子图。函数提供了一种更现代的方式来创建平铺的图形布局。然后使用这些网格数据和一个函数来计算Z的值。允许定义网格布局,并在这些网格中放置轴。然后,使用不同的函数来绘制三维图形。首先创建X和Y的网格数据。

2024-05-14 21:47:06 954 2

原创 matlab使用1-基础

命令行窗口输入:clc可清除命令行窗口command window的内容clc命令行窗口输入:clear all可清除命令行窗口command window + 工作区work widow的内容clear up%% 注释 % 注释。

2024-05-14 21:43:21 936 2

原创 DJANGO_PART 1

本质上就是:在HTML中写一些占位符,由数据对这些占位符进行替换和处理。命令行创建的项目是标准的;命令行启动:python manage.py runserver。选择项目目录(项目存放的地址,不是python安装的地址)在开发过程中一般将图片、css、js、都当作静态文件处理。django中项目会有一些默认的文件和默认的文件夹。安装语句:pip install django。templates目录(暂时不需要,可删除)一个项目往往有多个app,也可只有一个app。:在app目录下创建static文件夹。

2024-05-08 20:32:34 743 1

原创 机器学习_朴素贝叶斯

朴素贝叶斯算法(Naive Bayes Algorithm)是一种基于贝叶斯定理与特征条件独立假设的分类方法。该算法假设给定目标值时,各个特征之间相互独立。朴素贝叶斯算法通过训练数据集学习联合概率分布,并基于此模型,对给定的输入实例,利用贝叶斯定理求出后验概率最大的输出。具体来说,朴素贝叶斯算法的核心思想是:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

2024-05-08 10:38:29 536 1

原创 机器学习_KNN算法

K-近邻(K-Nearest Neighbors,简称KNN)算法是一种基本的机器学习分类和回归算法其核心思想是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

2024-05-06 09:13:42 1196

原创 KNN、NB、SVM实现鸢尾花分类

在欧氏距离度量方式下,k值为6、7、8、9、11、12、13、14、17、18、19时,准确率、精准率、召回率、F1值均达到100%;在曼哈顿距离度量方式下,k值为6、7、8、9、11、13、14、15、16、17、19、10时,准确率、精准率、召回率、F1值均达到100%箱线图能够清晰地展示数据的分布,包括上四分位数(Q3)、中位数(Q2)、下四分位数(Q1)、最大值(非异常值中的最大值)和最小值(非异常值中的最小值),这些信息可以帮助我们了解数据在各个特征上的分散程度。

2024-05-06 09:05:21 2498

原创 python 7_SQL基础

对于数据的处理可以分为数据的存储(TXT、EXCEL、数据库)、数据的计算(编程语言)数据的存储:数据->表->库数据库管理需要借助数据库管理系统,即我们常说的数据库软件:数据库是用来存储数据的,在这个过程中,会涉及到:数据的新增、数据的删除、数据的修改、数据的查询、数据库/数据表的管理等等,而SQL语言,就是一种对数据库、数据进行操作、管理、查询的工具;使用数据库软件去获得库->表->数据,这种数据组织、存储的能力,并借助SQL语言,完成对数据的增删改查等操作。

2024-04-23 17:41:30 883

原创 python 6_面向对象

类的定义。

2024-04-23 17:39:24 848

原创 操作系统1_操作系统概述

是计算机系统中的一个系统软件,它是这样一些程序模块的集合:它们能有效地组织和管理计算机系统中的硬件及软件资源,合理地组织计算机工作流程,控制程序的执行,并向用户提供各种服务功能,使得用户能够灵活、方便和有效地使用计算机,使整个计算机系统能高效地运行。多用户多任务:UNIX OS(Saloris、Linus、Mac)、MS-DOS(Windows 10)(计算机系统的组成:用户、应用程序、操作系统OS、硬件(裸机))一种联机的、交互式的单用户OS,其联机交互功能与通用分时系统相似。

2024-04-10 11:02:17 640 1

原创 机器学习案例-决策树实现鸢尾花分类

"""iris数据集:return:无返回值"""# 获取数据集print("查看数据集描述:\n", iris["DESCR"])

2024-04-07 08:59:43 2674

原创 机器学习_决策树

分类是机器学习中的一类重要问题;分类算法是利用训练样本集获得分类函数即分类模型(分类器),从而实现将数据集中的样本划分到各个类中;分类模型是学习训练样本中属性集与类别之间的潜在关系,并以此为依据对新样本属于哪一类进行预测。是一种基于规则的方法,它用一组嵌套的规则进行预测,可用于分类问题和回归问题。在树的每个决策节点处,根据判断结果进入一个分支,反复执行这种操作直到叶子节点,得到预测结果。

2024-04-07 08:07:31 1034

原创 机器学习入门1

机器学习、人工智能、深度学习三者之间的关系机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来1956达特茅斯会议——人工智能的起点用机器来模仿人类学习以及其他方面的智能1956年人工智能元年人工智能应用场景:传统预测、图像识别、自然语言处理数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程特征工程包含内容:特征抽取/提取、特征预处理、特征降维。

2024-03-30 20:30:37 563

原创 python基础5_案例总结+数据可视化

如果想要做出数据可视化效果图,可以借助pyecharts模块来完成概况:echarts是个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而python是门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时pyecharts诞生了pyecharts模块安装:pip install pyecharts查看官方示例:打开官方画廊(https://gallery.pyecharts.org/#/README)

2024-03-29 22:02:23 915 1

原创 卓音前端第一次讨论班_实例分析(涉及知识点:HTML、CSS基础)

标题标签系列-- 字体加粗,字号逐渐减小,独占一行 --> < h1 > < h2 > < h3 > < h4 > < h5 > < h6 > -- 字体加粗,字号逐渐减小,独占一行 --> < h1 > < h2 > < h3 > < h4 > < h5 > < h6 >

2024-03-29 08:15:13 2287 1

原创 python基础4_文件+异常相关

每个python文件都可以作为一个模块,模块的名字就是文件的名字,也就是说,自定义模块的名字必须要符合标识符命名规则测试模块:在实际开发中,当一个开发人员编写完一个模块后,为了让模块能够在项目中达到想要的效果,开发人员会自行在py文件中添加一些测试信息print(a+b)test(1,1)问题:此时,无论是当前文件,还是其他已经导入了该模块的文件,在运行的时候都会自动执行test函数的调用print(a+b)# 只在当前文件中调用该函数,其他导入的文件内将不再执行test(1,1)

2024-03-28 19:36:36 561

原创 python基础3_函数+组合数据类型

函数是组织好的、可重复使用的、用来实现特定功能的代码块。使用函数,可以得到一个针对特定需求、可供重复利用的代码段,提高程序的复用性,减少重复性代码,提高开发效率。def 函数名(传入参数) : 函数体 return 返回值函数名(参数)参数如不需要,可以省略返回值如不需要,可以省略函数必须先定义后使用print("欢迎来到这里!")print("请出示您的健康码以及72小时核算证明。")是否支持下标索引:支持(序列类型):列表、元组、字符串不支持(非序列类型):集合、字典。

2024-03-28 10:16:29 1005

原创 Python基本语法2_语句相关

continue的作用是:中断所在循环的当次执行,直接进入下一次break的作用是:直接结束所在的循环注意事项:continue和break,在for和while循环中作用一致在嵌套循环中,只能作用在所在的循环上,无法对上层循环起作用。

2024-03-20 16:45:30 613

原创 Python基本语法

单引号定义法:name = ‘nenu’双引号定义法:name = “nenu”三引号定义法:name = “”“nenu”“”三引号定义法和多行注释的写法一样,同样支持换行操作:使用变量接收它,它就是字符串;不使用变量接收它,就可以作为多行注释使用。单引号定义法,可以内含双引号双引号定义法,可以内含单引号可以使用转义字符(\)来将引号解除效用,变成普通字符串。

2023-11-23 14:34:36 725

DJANGO-PART 1

django初识_学习过程中的练习代码

2024-05-08

KNN、NB、SVM实现鸢尾花分类-代码+结果表格/图表

KNN、NB、SVM实现鸢尾花分类_代码+结果表格/图表

2024-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除