自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 从零开始重新学python第十一天--迭代器和生成器

表达式接收新值,并根据这些值实时计算并返回平均值。这种设计可以高效地处理流式数据,并在每次接收到新值时更新并返回最新的平均值。这样,生成器就可以作为协程使用,协程简单的说就是可以。方法的对象称为迭代器,遵循迭代器协议。方法发送数据,发送的数据会成为生成器函数中通过。给调用者,同时等待外部通过 send。方法发送一个新值,这个新值会被赋值给。在 Python 中,实现了。

2024-08-08 08:48:45 129

原创 中间件的应用

中间件是安插在Web应用请求和响应过程之间的组件,它在整个Web应用中扮演了拦截过滤器的角色,通过中间件可以拦截请求和响应,并对请求和响应进行过滤(简单的说就是执行额外的处理)。通常,一个中间件组件只专注于完成一件特定的事,例如:Django框架通过中间件实现了对session的支持,又通过中间件实现了基于session的请求认证。通过把多个中间件组合在一起,我们可以完成更为复杂的任务,Django框架就是这么做的。Django项目的配置文件中就包含了对中间件的配置,代码如下所示。

2024-08-08 08:24:03 656

原创 LSLM论文

在实时对话的情境下与用户交互的能力有所欠缺,例如:当生成的对话不满意时被打断。所以,这篇论文在实时的的语音语言模型(interactive speech language models (iSLM))中采用。(full duplex modeling (FDM)),旨在增强实时交互性,明确来说,探索打断能力的精髓。现在的语音模型(SLM)增强了语音对话的能力,但都局限于。

2024-08-08 08:06:23 937

原创 dataspeech仓库处理语音数据

中英文数据处理结果查看dataspeech仓库提供了完整代码以及运行脚本来为语音数据集打标签。总体而言将处理过程分为三个阶段,第一个阶段基于原始数据集,为每一段音频计算诸如"音高,讲话速度,信噪比"等等的特征。第二阶段使用第一阶段生成的特征将原本特征的数值映射到一个个区间中。例如:讲话速度由第一阶段的速度值变为第二阶段处理完后的"相当慢-相当快"等七个区间(区间个数可预设)。第三阶段通过接入LLM,使用第二阶段的特征生成prompt,让LLM生成每一段音频的文本描述。

2024-08-07 15:33:08 686

原创 日志和调试工具栏

4.在配置好Django-Debug-Toolbar之后,页面右侧会看到一个调试工具栏,如下图所示,上面包括了如前所述的各种调试信息,包括执行时间、项目设置、请求头、SQL、静态资源、模板、缓存、信号等,查看起来非常的方便。的属性,它代表了日志的级别,不同的日志级别反映出日志中记录信息的严重性。的神器,它是项目开发阶段辅助调试和优化的必备工具,只要配置了它,就可以很方便的查看到如下表所示的项目运行信息,这些信息对调试项目和优化Web应用性能都是至关重要的。1.安装Django-Debug-Toolbar。

2024-08-07 11:36:58 377

原创 从零开始重新学python第11天--面向对象

对象创建的逻辑集中在工厂类中,客户端代码只负责使用对象。不使用工厂模式的话客户端代码既负责创建对象又负责使用对象,职责不单一,增加了代码的复杂性。通过工厂模式,客户端代码无需知道具体的类名和构造函数细节,只需提供所需对象的类型,工厂类会负责创建并返回相应的对象。类,我们可以创建一组有意义的常量,通常用于表示一组相关的常量值,如一副牌中的花色或一周中的天数。在 Python 中,特殊方法(或魔术方法)是以双下划线开头和结尾的方法,用于实现特定的操作行为。是一个装饰器,用于确保枚举类中的值是唯一的。

2024-08-07 09:25:10 181

原创 Cookie和Session

实现“用户登录”的功能,并限制只有登录的用户才能投票。1.创建用户模型。之前我们讲解过如果通过Django的ORM实现从二维表到模型的转换(反向工程),这次我们尝试把模型变成二维表(正向工程)。2.使用下面的命令生成迁移文件并执行迁移,将模型直接变成关系型数据库中的二维表。3.用下面的SQL语句直接插入两条测试数据,通常不能将用户的密码直接保存在数据库中,因此我们将用户密码处理成对应的MD5摘要。MD5消息摘要算法是一种被广泛使用的密码哈希函数(散列函数),可以产生出一个128位(比特)的哈希值

2024-08-06 22:45:36 754

原创 静态资源和Ajax请求

接下来就可以实现“好评”和“差评”的功能了,很明显如果能够在不刷新页面的情况下实现这两个功能会带来更好的用户体验,因此我们考虑使用Ajax技术来实现“好评”和“差评”。Ajax是Asynchronous Javascript And XML的缩写 , 简单的说,使用Ajax技术可以在不重新加载整个页面的情况下对页面进行局部刷新。

2024-08-06 21:15:48 542

原创 django之深入模型

Django是基于MVC架构的Web框架,MVC架构追求的是“”和“”的解耦合。所谓“模型”说得更直白一些就是,所以通常也被称作“在实际的项目中,数据模型通常通过数据库实现操作,而在过去和当下都是持久化的首选方案,下面我们通过完成一个投票项目来讲解和模型相关的知识点。投票项目的首页会展示某在线教育平台所有的学科;点击学科可以查看到该学科的老师及其信息;用户登录后在查看老师的页面为老师投票,可以投赞成票和反对票;未登录的用户可以通过登录页进行登录;尚未注册的用户可以通过注册页输入个人信息进行注册。

2024-08-06 20:44:56 595

原创 Django快速上手

Python的Web框架有上百个,比它的关键字还要多。所谓Web框架,就是用于开发Web服务器端应用的基础设施,说得通俗一点就是一系列封装好的模块和工具。事实上,即便没有Web框架,我们仍然可以通过socket或CGI来开发Web服务器端应用,但是这样做的成本和代价在商业项目中通常是不能接受的。通过Web框架,我们可以化繁为简,降低创建、更新、扩展应用程序的工作量。

2024-08-06 18:26:20 586

原创 从零开始重新学python第九天--图像和办公文档处理

用程序来处理图像和办公文档经常出现在实际开发中,Python的中虽然没有直接支持这些操作的模块,但我们可以通过Python中的第三方模块来完成这些操作。

2024-08-05 09:49:31 234

原创 从零开始重新学python第八天--网络编程入门

计算机网络是独立自主的计算机互联而成的系统的总称,组建计算机网络最主要的目的是实现多台计算机之间的通信和资源共享。

2024-08-04 09:56:05 828

原创 从零开始重新学python第七天--进程和线程

今天我们使用的计算机早已进入多CPU或多核时代,而我们使用的操作系统都是支持“”的操作系统,这使得我们可以同时运行多个程序,也可以将一个程序分解为若干个相对独立的子任务,让多个子任务并发的执行,实现让程序同时执行多个任务也就是常说的“并发编程”。为此,我们需要先讨论两个概念,一个叫进程,一个叫线程。

2024-08-02 20:34:14 582

原创 从零开始重新学python第六天--文件和异常

实际开发中常常会遇到对数据进行操作的场景,而实现数据持久化最直接简单的方式就是将就是将内存中的数据模型转换为存储模型,以及将存储模型转换为内存中的数据模型的统称. 数据模型可以是任何数据结构或,存储模型可以是、XML、二进制流等。是一种用于向用户提供底层数据访问的机制。是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易。文件系统使用和。

2024-08-01 08:17:11 872

原创 从零开始重新学python--面向对象编程

实际上,我们写在类中的方法并不需要都是对象方法,例如我们定义一个“三角形”类,通过传入三条边长来构造三角形,并提供计算周长和面积的方法,但是传入的三条边长未必能构造出三角形对象,因此我们可以先写一个方法来验证三条边长是否可以构成三角形,这个方法很显然就不是对象方法,因为在调用这个方法时三角形对象尚未创建出来(因为都不知道三条边能不能构成三角形),所以这个方法是属于三角形类而并不属于三角形对象的。写在类中的函数,我们通常称之为(对象的)方法,这些方法就是对象可以接收的消息。下面我们先看一个继承的例子。

2024-07-31 11:26:48 685

原创 从零开始重新学python第五天--常用数据结构

字符串中使用'\'表示转义,即'\'后面的字符不再是它原来的意义。,Python中的字典跟我们生活中使用的字典是一样一样的,它可以存储任意类型对象,与列表、集合不同的是,字典的每个元素都是由一个键和一个值组成的“键值对”,键和值通过冒号分开。),也是一种结构化的、非标量类型,它是值的有序序列,每个值都可以通过索引进行标识,定义列表可以将列表的元素放在。Python中的集合跟数学上的集合是一致的,不允许有重复元素,而且可以进行交集、并集、差集等运算。,也就是说这种类型的对象没有可以访问的。

2024-07-31 10:38:26 861

原创 从零开始重新学python第四天

需要说明的是,如果我们导入的模块除了定义函数之外还有可以执行代码,那么Python解释器在导入这个模块时就会执行这些代码,事实上我们可能并不希望如此,因此如果我们在模块中编写了执行代码,最好是将这些执行代码放入如下所示的条件中,这样的话除非直接运行该模块,if条件下的这些代码是不会执行的,因为只有直接执行的模块的名字才是"__main__"。从现在开始我们可以将Python代码按照下面的格式进行书写,这一点点的改进其实就是在我们理解了函数和作用域的基础上跨出的巨大的一步。,那么下面一行的代码就会定义变量。

2024-07-22 10:32:34 560

原创 从零开始重新学python第三天--分支循环

在这个场景中,让机器人向球门方向移动就是一个需要重复的动作,当然这里还会用到上一课讲的分支结构来判断机器人是否持球以及是否进入射门范围。然而仅有顺序结构并不能解决所有的问题,比如我们设计一个游戏,游戏第一关的通关条件是玩家获得1000分,那么在完成本局游戏后,我们要根据玩家得到分数来决定究竟是进入第二关,还是告诉玩家“Game Over”,这里就会产生两个分支,而且这两个分支只有一个会被执行。就是专门用于构造分支结构的关键字,很显然你不能够使用它作为变量名(事实上,用作其他的标识符也是不可以)。

2024-07-16 09:15:39 235

原创 从零开始重新学python第二天--语言元素

其中,运算器和控制器放在一起就是我们通常所说的中央处理器,它的功能是执行各种运算和控制指令以及处理计算机软件中的数据。我们通常所说的程序实际上就是指令的集合,我们程序就是将一系列的指令按照某种方式组织到一起,然后通过这些指令去控制计算机做我们想让它做的事情。计算机中的变量是实际存在的数据或者说是存储器中存储数据的一块内存空间,变量的值可以被读取和修改,这是所有计算和控制的基础。Python中的数据类型很多,而且也允许我们自定义新的数据类型(这一点在后面会讲到),我们先介绍几种常用的数据类型。

2024-07-15 08:47:36 548

原创 从零开始重新学python第一天

Python(英式发音:/ˈpaɪθən/;美式发音:/ˈpaɪθɑːn/)是由荷兰人吉多·范罗苏姆(Guido von Rossum)发明的一种编程语言,是目前世界上最受欢迎和拥有最多用户群体的编程语言。可在TIOBE Index网站(编程语言受欢迎指数) 和IEEE Spectrum网站(收录全球最新科技杂志)上感受到python在编程语言中的王者地位。

2024-07-14 10:07:16 638

原创 CS224N Assignment 1: Exploring Word Vectors

词向量经常被用作下游nlp任务的基本组成部分,例如:问答,文本生成,机器翻译。这里,我们要学习两种类型的词向量,基于词共现矩阵的和基于Glove的大多数词向量的构建都源于如下想法:相似的词语会出现在相似的语境之中。因此,相似的词语经常出现在一个公共的词语集合中。通过检查这些语境,我们可以构建词嵌入。词共现矩阵计数了一个窗口大小下每个词语共同出现的次数。如图:在自然语言处理中,我们通常使用<START>和<END>词元标记语文档料的开头和结尾。这些词元也被包含在词共现矩阵中,封装着每个文档。

2024-05-02 21:23:51 15 1

原创 初识量化交易

把策略转换为程序,让计算机能根据历史数据模拟执行该策略,以及能根据实际行情进行反应并模拟交易或真实交易。在金融最为发达的美国,量化交易已大行其道,占据了70%以上的股市成交量。可以说量化交易是未来的趋势。量化交易是指借助现代统计学和数学的方法,利用计算机技术来进行交易的证券投资方式。检验策略效果,基本检验策略方法有回测和模拟交易两种方法。

2024-05-01 20:21:47 32

原创 大模型黑书阅读笔记--第一章

启发提出了RNN,20世纪80年代,CNN应用于文本序列,并制作出LeNet-5,然而在处理长而复杂序列中的长期依赖关系时,CNN原本的高效架构达到了极限。过了没有更多进展的30年,到2017,工业化的最先进的transformer出现了,RNN不再是序列建模的先决条件了。transformer诞生:大型科技公司不得不找到更好的模型来应对流入数据中心的PB级数据的指数增长,需要一个AI模型就能处理各种任务,而这些任务往往是需要用不同的算法单独处理的。提出AI这个词,确定了机器是可以学习的,1982年。

2024-05-01 12:05:49 390

原创 pytorch入门项目--猫狗大战

现__init__(定义神经网络结构,包括各个层的初始化和参数设置)和forward(定义神经网络的前向传播过程)两个方法。,实现该抽象类的__getitem__方法(根据索引取图片)和__len__方法。6.实例化优化器,即调整网络参数的方式,引自。注:加粗字块均可以去官网阅读源码。定义项目的神经网络模型,继承自。导入pytorch官方模块。定义项目数据集类,继承自。4.网络送入GPU,即。

2024-04-30 16:24:55 80

原创 cs224n课程学习

这篇博文记录一下cs224n课程学习过程的资料地址。2.cs自学指南对该课程进行了资源汇总。3.课程所有资源和作业。

2024-04-08 10:09:43 183 1

原创 变量声明位置引发的断触c++学习

函数体内定义变量时,从栈空间申请内存进行储存,栈空间在进程创建时初始化,大小由系统固定,因此定义较大内存的变量(如大数组),编译可以通过但是运行不了。而当我们把变量的定义放在函数体以外时,所申请的内存来自于数据段,内存大小按需分配,可以自由增长,所以可以特别大。

2024-04-04 16:48:14 148 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除