自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 自然语言处理3(NLP)—— 机器学习

在这个模型中,每次掷骰子的结果可以是1、2、3、4、5或6,这六种结果构成了我们的样本空间,即所有可能发生的结果。似然函数表示的是,在给定参数下,观测到当前实验结果(正面朝上 7 次,反面朝上 3 次)的概率。根据二项分布,这个概率可以表示为:其中,是似然函数,是硬币正面朝上的概率。随机事件就是可能发生也可能不发生的事情,比如掷硬币的结果。参数化:比如神经网络参数。随机变量是一个数字,它基于随机事件的结果给出一个值,比如基于掷硬币结果给出的得分。

2024-03-27 01:35:11 504

原创 密码学及其应用1 —— 密码学概述

根据国际标准化组织(ISO)在ISO-17799标准中的定义,保密性是指确保信息只能被授权访问的人员获取。这里提到的“访问”特指获取信息的能力,意味着信息的保护不仅仅是防止未经授权的物理访问,还包括通过电子手段访问和检索信息。可用性定义为系统或设备在任意给定时刻(随机的)处于可操作状态以执行任务的程度。它是通过将设备或系统的实际运行时间除以期望运行时间来衡量的性能指标。简而言之,可用性衡量的是系统、服务或设备能够按预期工作并可供用户访问的能力和程度。数据完整性是指在数据的处理、保存或传输过程中,数据。

2024-03-25 08:19:46 1161

原创 自然语言处理(NLP)—— 语义关系提取

语义关系是指。这些关系可以是,也可以是。在自然语言处理(NLP)和文本挖掘领域,对于都是非常重要的。

2024-03-12 23:22:47 1458

原创 自然语言处理(NLP)—— 词义消歧与词语相似性(Word similarity)

然后取目标词每个定义中的词汇,并将这。

2024-03-11 08:22:12 1048

原创 自然语言处理(NLP)—— 生成式模型和判别式模型

生成式模型关注于如何根据数据生成过程来建模数据,能够生成新的数据实例,并试图理解数据的整体分布。判别式模型专注于区分不同的数据类别,学习输入与输出之间的直接映射关系,通常在预测任务上表现更优。选择生成式模型还是判别式模型取决于特定任务的需求,比如是否需要数据生成能力,数据的数量和质量,以及预测准确率的要求等。在实际应用中,这两类模型往往是互补的。

2024-03-10 21:51:52 675

原创 自然语言处理(NLP)—— 语言学、结构的主要任务

文本摘要是指从一个或多个文档中提取关键信息,并生成一个包含主要内容的较短文本的过程。根据需求,摘要可以是抽取式的(直接从原文选取关键句或短语)或生成式的(重新表述原文的关键信息)。

2024-03-06 21:26:12 1088

原创 计算机网络——IPV4数字报

本结构遵循的是RFC 791规范,介绍了一个IPv4数据包头部的不同字段。 a. 版本(Version):指明了IP协议的版本,IPv4表示为4。 b. 头部长度(IHL, Internet Header Length):指明了头部的长度,以32位的字为单位。 c. 服务类型(Type of Service,简称ToS):指明了数据包的服务质量,它的设计目的是让发送者指明数据包的处理优先级和要求: ToS的使用并不普遍,因为不是所有的网络设备都会利用

2024-02-27 09:07:14 1300

原创 密码学及其应用(应用篇15)——0/1背包问题

想象你有一堆不同重量的宝石,这些宝石的重量构成了一个超增长序列,即后面的宝石总比前面所有宝石的总重量要重。你有一个秘密数字和一个公开的大数字,这两个数字互不相同且都很特别(它们互质,意味着除了1以外没有其他公共因子)。接收方知道你的秘密数字、每个宝石的原始重量,以及加密消息。他们要找出你选择了哪些宝石。这个基于超增长背包序列的公钥加密协议允许安全地加密和解密消息,即使是在公开的通信渠道中。公钥用于加密消息,而只有持有私钥的接收方能够解密这个消息。

2024-02-25 23:45:44 1207

原创 分布式系统 —— 分布式线性回归的应用

在本文中,你将学习如何在分布式环境中实现线性回归。

2024-02-24 05:23:00 889

原创 RISC-V知识总结 —— 指令集

R型指令通过提供一系列富有表现力的算术和逻辑操作,是RISC-V架构中实现高效数据处理的基础。这些指令的设计充分利用了处理器内部寄存器的高速访问能力,使得RISC-V处理器能够快速执行复杂的数值和逻辑计算,支撑起各种计算密集型应用的需求。I型指令通过结合寄存器操作和立即数操作,为RISC-V提供了灵活的数据处理能力。这包括直接的算术和逻辑操作,以及支持高效的内存访问和简单的条件处理。立即数的使用极大地增强了指令的表达能力,使得程序能够直接编码常数值和偏移量,从而简化代码并提高执行效率。将。

2024-02-23 00:01:58 2475 1

原创 自然语言处理(NLP)—— 神经网络自然语言处理(2)实际应用

通过定义一个 read_corpus 函数,我们可以逐行读取文件,并使用 Gensim 的simple_preprocess 对每一行进行简单的预处理(比如分词),然后将每个句子标记为`、TaggedDocument。每个`TaggedDocument`包含处理过的单词和一个唯一的标签(在这里,我们使用句子的行号作为标签)。

2024-02-22 00:37:50 1703

原创 自然语言处理(NLP) —— 心理语言学

认知科学和心理语言学是两个密切相关的领域,它们研究认知过程和语言使用是如何相互作用的。 在历史上,这两个领域的发展经历了几个重要的阶段: Wundt 和其他德国心理学家使用一种叫做内省法的研究方法。内省法是一种主观的方法,研究者通过自我观察和分析个人的思维过程来研究心理现象。这种方法高度依赖于个体的自我报告,因此在客观性上存在限制。 Watson 和其他美国心理学家提出了行为主义。行为主义者拒绝发展任何关于心智操作的理论,他们只观察可见的行为,并尝试通过刺激与反应之

2024-02-19 03:24:01 1479 1

原创 计算机网络——网络安全

TLS(Transport Layer Security)是SSL(Secure Sockets Layer)的后继者,用于提供基于TCP/IP的应用层安全性。

2024-02-18 00:00:05 3426 1

原创 RapidMiner数据挖掘2 —— 初识RapidMiner

本节由一系列练习与问题组成,这些练习与问题有助于理解多个基本概念。它侧重于各种特定步骤,以进行直接的探索性数据分析。因此,其主要目标是测试一些检查初步数据特征的方法。大多数练习都是关于图表技术,通常用于数据挖掘。为此,我们将使用。请求的工作包括发现应用程序的图形用户界面(GUl),以及检查和处理示例数据集的不同元素。

2024-02-16 21:03:32 2876

原创 自然语言处理1(NLP)—— 基本概念介绍

在定义NLP之前,先了解几个相关概念:语言(Language):是人类用于沟通的一种结构化系统,可以包括声音、书写符号或手势。自然语言(Natural Language):是指自然进化中通过使用和重复,无需有意计划或预谋而形成的语言。计算语言学(Computational Linguistics):是语言学和计算机科学之间的跨学科领域,它包括:a.计算机辅助语言学(Computer-aided Linguistics):利用计算机研究语言的学科,主要为语言学家所实践。

2024-02-11 23:57:34 1905 1

原创 法国实习面试——计算机相关专业词汇

1.Spécialité - 专业2.Système - 系统3.Embarqués - 嵌入式4.Logicielle - 软件5.Distribués - 分布式6.Électronique - 电子7.Énergie électrique - 电能8.Automatisation - 自动化9.Une expérience de stage - 实习经验10.Automobiles - 汽车11.Être chargé de - 负责12.Développement - 开发。

2024-02-08 23:49:29 1088

原创 自然语言处理(NLP)——使用Rasa创建聊天机器人

IR-BOT:检索型问答系统Task-bot:任务型对话系统Chitchat-bot:闲聊系统。

2024-02-07 23:29:27 2317 2

原创 英语学习——16组英语常用短语

look at 看look for 寻找look up 查阅,向上看look out 向外看,小心look after 照顾look like 看起来像look through 浏览look into 向里看look around 环顾四周look forward to 期盼look ahead 向前看Look back on 回顾或回忆过去的事情或经历Look up to 仰望或敬佩某人。Looking down on 轻视或鄙视某人或某事。B back on。

2024-02-06 22:48:09 808

原创 计算机网络——新型网络架构:SDN/NFV

SDN将网络的控制平面(决定流量应该如何流动)与数据平面(根据这些决策转发流量)分离。这种分离允许更加可编程和动态的网络控制。SDN的这些抽象概念共同构成了其创新的核心。通过提供全局网络视图、简化的网络控制和灵活的转发机制,SDN极大地提高了网络的可管理性、可编程性和适应性。这种新的网络管理方法为网络设计和操作带来了革命性的变化。Ethane项目是“Clean Slate(干净的画板)”计划的一部分,这个计划旨在探讨如果我们从零开始重建互联网,它在15年后会是什么样子。

2024-02-05 01:05:10 1417

原创 数学电路与电子工程2(MEE)—— 时序电路的寄存器和工作频率

D锁存器(Verrou ou D latch),它是一个简单的存储设备,可以在使能信号(E)处于活动状态时存储一位数据。D触发器(Bascule ou D flip-flop),它是一个边沿触发的存储设备,只有在时钟信号(H)的上升沿或下降沿时才会更新它的输出状态。在数字电子和计算机工程中,一个寄存器是一组用来存储数字数据的触发器(例如,D触发器)。存储寄存器:这类寄存器主要用于存储数据。数据操作:某些类型的寄存器可以进行简单的数据操作,如位移(向左或向右移动),这对于执行数学运算或数据格式转换非常有用。

2024-02-04 01:30:21 915

原创 大规模机器学习简介

参数服务器(Parameter Server)架构是一种流行的大规模机器学习系统设计,用于处理分布式计算环境中的模型参数更新和同步。在这种架构中:状态性参数服务器:负责维护模型参数的当前版本。这意味着参数服务器存储并管理着模型的全局状态。工作节点(Workers):使用本地可用的模型版本进行计算,产生参数的“增量”更新(即参数的局部更改)。工作节点可能分布在不同的机器上。

2024-02-03 22:14:54 1099

原创 自然语言处理(NLP)—— Dialogflow ES聊天机器人

这个实验室的目标是让你了解并使用Google的Dialogflow服务。Dialogflow是一个可以让你创建聊天机器人的服务,这个过程不需要或者只需要很少的编程技能。

2024-02-02 10:56:39 2324

原创 数学电路与电子工程1(MEE)—— 锁存器和触发器

这是一个在高电平(active-high)时使能的D锁存器(D Latch)的CMOS实现以及其符号表示。D锁存器是一种基本的存储元件,它在使能信号E(Enable)为高电平时将数据输入D(Data)的状态“锁存”到输出Q上。当E为低电平时,锁存器将保持其输出不变,即使D的状态改变。实现D锁存器的两种方法是:a.使用RS锁存器:可以通过将RS锁存器的R(Reset)和S(Set)输入连接到D信号和E信号的适当组合来构建D锁存器。

2024-01-29 21:40:15 1367

原创 远程方法调用Remote Method Invocation

开始RMI编程的第一步是定义一个接口,该接口声明了将可以远程调用的方法。这个接口必须继承自 `java.rmi.Remote` 接口。接口不能定义字段(成员变量)。它们只能定义方法。尽管可以在接口中定义常量(public static final变量)。

2024-01-28 22:53:36 1103

原创 带延迟的随机逼近方案(Stochastic approximation schemes):在网络和机器学习中的应用

即使没有通信,也使用了一种迭代算法来更新每个传感器的估计值。因此,尽管长期行为可能是相似的,短期内算法可能会表现出不同的动态,特别是在收敛到稳定点的路径上。然而,根据上述假设,我们可以推断即使有这样的延迟,长期来看,算法的行为仍然类似于其对应的不带延迟的常微分方程。如果有一个确定性的常微分方程能够收敛到期望的状态,那么通过对应的随机逼近可以构造一个概率性的算法,它在长期内也会收敛到相同的状态。并且与相应的常微分方程的解的行为趋于一致,这是因为噪声项的影响平均来看会被减小,而变化的步长会确保最终的稳定性。

2024-01-27 21:01:04 1217 1

原创 接入技术以及互联网架构

设施包括。铜线和光纤是用来,其中光纤以其高速度和大容量而闻名,而铜线则是一种更传统的技术。无线基础设施则包括高点(如专门建造的塔架或现有的高点,如钟楼、水塔等)上的天线。这些天线可以是。这些设备用于发送和接收无线信号,使得数据可以在不同的地点之间。部署和维护这些物理基础设施是运营商投资和运营成本的重要组成部分。这些基础设施可以专门用于一个运营商,也可以由多个运营商共享。输网络,即用于。这些信息表明,无论是有线还是无线基础设施,都是通信网络不可或缺的组成部分,需要大量的投资和维护工作。

2024-01-26 09:03:16 1077

原创 分布式应用程序设计项目管理

这通常是一项持续的活动,涉及更新和修复现有的软件代码,而不是创建一个有特定开始和结束的新项目。

2024-01-25 05:45:22 1163

原创 分布式系统——树状算法

广播操作是由单个处理器(源节点)发起的,其目的是向系统中的所有其他节点发送一条消息。两节点间的距离:在无向图G中,节点u 和v之间的距离是指u和v之间最短路径的长度。节点的半径:节点u的半径是指u与图中任何其他节点之间的最大距离,表示为图的半径:图的半径是指图中任何节点半径的最小值,表示为图的直径:图的直径是指图中任意两个节点之间最大距离的最大值,表示为引理:消息复杂度:广播的消息复杂度至少是 n - 1 ,其中 `n` 是图中的节点数。

2024-01-21 05:44:49 907

原创 二进制数据传输中错误的检测与修正

错误检测:如果消息在传输过程中没有发生错误,最终的计算结果Z''应该是全1,即`1111 1111`(8位的情况)或者对应长度的全1。CRC-32:使用一个32位长的生成多项式,通常用于以太网,`x^32 + x^26 + x^23 + x^22 + x^16 + x^12 + x^11 + x^10 + x^8 + x^7 + x^5 + x^4 + x^2 + x + 1`。除法与余数:将修改后的消息`M'`(即`M`乘以`x^n`的结果)除以生成多项式`G`,得到的余数就是CRC码。

2024-01-20 05:53:47 1018

原创 二进制数据传输中的校验方法

公式`T = M' - R = G × Q`展示了如何通过生成多项式`G`来确保传输的数据`T`在没有错误的情况下能够被`G`整除。除法与余数:将修改后的消息`M'`(即`M`乘以`x^n`的结果)除以生成多项式`G`,得到的余数就是CRC码。多项式乘法:将消息`M`乘以`x^n`(等同于将`M`向左移`n`位),这样可以在`M`的末尾腾出`n`位空间。构造传输多项式:然后构造一个新的多项式`T`,它等于`M'`减去余数`R`(在模2算术中,减法与加法相同)。如果不同,则认为消息在传输过程中发生了错误。

2024-01-19 08:45:14 652

原创 计算机网络——第四层:传输层以及TCP UDP

接收方收到的数据将保持发送方发送时的数据结构,即数据的边界是对齐的。这与TCP不同,TCP会将所有发送的数据作为一个连续流处理,接收方可能会在一个单独的数据块中接收到部分或全部数据,而不一定保持原始消息的边界。为了解决这个限制,RFC 1323 引入了窗口缩放选项,它允许窗口大小字段的值乘以2^n(其中n是窗口缩放因子,最高可到14),从而允许更大范围内的窗口大小,增加了流量控制的灵活性。通过只重传丢失的数据,而不是连续的数据序列,它减少了不必要的网络流量和可能的拥塞,从而提高了TCP连接的整体性能。

2024-01-18 06:26:01 1348

原创 计算机网络安全——密码学入门

非对称加密虽然速度较慢,但它解决了密钥分发的问题,因为它允许任何人使用公钥加密消息,只有持有对应私钥的人才能解密,这使得它非常适合用于数字签名和加密初始通信阶段的密钥交换。根据这些原则,一个加密系统的安全性主要取决于密钥的秘密保持和密钥空间的大小,而不是加密算法本身的秘密性。网络安全是指在网络领域、专业领域的网络安全包括在基础计算机网络基础设施中所做的规定,网络管理员采取的策略来保护网络及网络可访问资源免受未经授权的访问,以及对其有效性(或缺乏)的持续不断的监控和测量的结合。

2024-01-17 07:27:01 3004 1

原创 计算机网络——统一资源标识符URI

这是最常见的URI类型,它不仅标识资源,还提供了找到该资源的方法。URL包含了访问资源所需的所有信息,包括协议(如HTTP、FTP)、服务器位置和文件路径。例如,http://www.example.com/index.html 是一个URL,它告诉你资源是通过HTTP协议在`www.example.com`上的`/index.html`路径上找到的。URL包括协议(如HTTP、FTP),服务器的位置和资源在服务器上的具体位置。

2024-01-15 00:20:25 1309

原创 计算机网络——第三层:网络层

如图按照RFC 791规范显示了一个IPv4数据包头部的不同字段 IPv4头部通常包括以下部分: 指明了IP协议的版本,IPv4表示为4。 指明了头部的长度,以32位的字为单位。 指明了数据包的服务质量。IPv4头部中的“服务类型”(Type of Service,简称ToS)字段,它的设计目的是让发送者指明数据包的处理优先级和要求: 也称为“先行权”或“优先权”,它通常被设置为0,但可以被用来标记数据包在网络中的处理优先级。

2024-01-14 05:39:42 1207 2

原创 计算机网络——HTTP协议

q=0.2, audio/basic`表示客户端优先接收基本的音频类型,但也可以接受其他类型的音频内容,尽管它们的优先级较低(q=0.2)。所以,如果是一个请求,起始行会告诉服务器你想要做什么(方法),你想在哪里做(请求目标),以及你打算使用哪个版本的HTTP协议来通信。Connection: keep-alive:是一个请求头部,要求服务器保持连接打开,以便后续请求复用通过这些头部,HTTP消息可以携带关于请求或响应的附加信息,以及关于实体本身的数据。起始行:就像信封的标题,告诉我们这是什么类型的信息。

2024-01-12 01:38:22 1311

原创 计算机网络——多路复用技术

多路复用是一种技术,允许在一个传输介质上传输多个信号或信息流。这种技术对于优化资源使用和增加网络的传输能力至关重要。

2024-01-11 03:24:30 1413

原创 计算机网路——延迟

有些应用可以容忍较高的延迟,而对于实时应用,如网络电话(VoIP)或视频会议,延迟就变得非常关键。尽管这样,技术的进步已使得即使在延迟变化的网络中,像VoIP这样的电话服务也能成功运行。在实际中,传播速度还取决于传输媒介的类型,例如在光纤或铜线中,传播速度大约是光速的2/3。这个时间段与数据的大小成正比,并且与网络的带宽成反比。不同类型的通信服务对延迟的不同容忍程度,并且指出在设计和运行通信服务时,考虑延迟对服务质量的影响是非常重要的。在数据传输过程中,从发射器到接收器,数据会遇到的不同类型的延迟。

2024-01-10 05:42:48 943

原创 网络协议到底是什么?

本文介绍了通信协议的概念以及如何通过添加特定的机制和信息来确保无错误的数据传输。

2024-01-08 07:45:20 1280

原创 分布式系统——广播Broadcasts

在分布式系统的上下文中,Deliver 方法通常由底层的网络层实现,它确保消息能够跨越网络从一个节点传递到另一个节点。当一个进程调用 Broadcast(m) 方法广播消息时,系统会尝试将这个消息传递给所有其他的进程。每当这个消息到达一个进程,就会调用 Deliver(m,src) 方法,以便应用程序可以处理这个消息。

2024-01-07 15:40:06 1288 1

原创 分布式系统——共识问题

共识指的是关于某件事情的一般性协议,或者是一个由一组成员全部共享的想法或意见。在第一轮中,每个进程广播自己的值。然后,在每一轮中广播上一轮从其他进程收到的新值。每一轮中,将收到的所有新值加入到自己的值集合中。最后,在 f+1轮后,从自己所知的所有值中取最小值作为最终决定。5.2.1.5。

2024-01-06 18:49:00 1272 1

数据挖掘数据集,用于训练数据

数据挖掘数据集,用于训练数据

2024-02-15

自然语言处理(NLP)思诺学长-语言识别

自然语言处理(NLP)思诺学长-语言识别

2024-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除