数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展

78 篇文章 17 订阅
78 篇文章 9 订阅

近期学习汤小丹老师的《计算机操作系统》收获颇多,联想到之前有朋友说:Python比R语言好,原因是Python能处理的数据量比R语言大,在我看来二者并没有谁好谁差,只是看谁能用的好,谁用的频率大而已。

当数据量较大的时候,想是得需要借助多台计算机并行跨节点的方式才能处理。例如,目前已经有了PySpark 、SparkR等的分布式处理方法。

情况描述

1.使用软件对数据进行计算,常常伴随会出现执行时间长,数据卡顿的现象。

2.计算机执行程序的时候,通常在内存保存待处理的数据。程序是为了实现一个特定的目标而预先设计的一组可操作的工作步骤,就可以称为一个程序。对于计算机系统,程序就是系统可以识别的一组有序的指令。

3.这组指令指挥这计算机系统工作。对于计算机系统,简单的说,程序就是系统可以识别的一组有序的指令。程序存储在磁盘上,被加载到内存中,计算机系统从内存中逐条读取指令并执行。

因此数据卡顿这个原因是由于数据计算内存在进行控制,数据量的计算是在内存中发生,那内存的数量是一定的,怎么可能不会卡顿呢?

如何对数据计算过程中的卡顿进行一些改善,于是引入了计算机的虚存概念。

虚存的概念

**把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”,这是虚拟内存。**进程不完全载入,就叫虚存。可以分成按需取页和按需取段两种方式。

如果用户编制程序时,可以不考虑内存的实际容量,即允许程序中的逻辑地址空间大于内存的绝对地址空间,那么,会使用户感到极大的方便。存储管理利用磁盘作为内存的后援,当一个大型的程序要装入内存时,仅把当前需要的部分装入,其余部分暂留在磁盘上。程序执行中要用到不在内存中的信息时,再由操作系统将其装入内存。如果内存空间不够,则可由操作系统采用覆盖技术。这样,用户就感到计算机系统提供了容量极大的内存空间。实际上,这个容量极大的内存空间不是物理意义上的内存,而是操作系统中的一种存储管理方式,这种方式为用户提供的是一个虚拟的存储器。虚拟存储器比实际内存的容量大,起到了扩充内存空间的作用。

虚存的实际应用

以R语言为例,查看系统中对R语言能够处理的数据分配内存限制进行查看,使用memory.limit(),得到R语言的内存限制为8073,约为7.8G,和我计算机的最大内存接近,R语言在使用内存室,并没有多大的限制。
在这里插入图片描述

此时,R语言的内存使用是7.8G,这和系统的内存几乎相同,是不是意味着,内存没有办法进行增加?此时,可以进一步借助虚拟内存对R语言的内存进行扩增。输入memory.limit(102400),就直接把系统分配给R语言的内存使用上限调到100G。如下所示:
在这里插入图片描述

那这样操作是不是合理呢?并不是的,还需要在windows中对数据的虚拟内存进行适当上限的调整才可以。
在这里插入图片描述
对以上进行设置后,重启计算机,默认的虚拟内存就成功了。

不过再用R语言处理数据,需要每次新打开R语言之前都要运行memory.limit(102400)一下。

使用memory.size()查看现在的workspace的内存使用情况和之前的内存情况是否相同。

memory.limit()
memory.limit(102400)
memory.size()

在这里插入图片描述

当再次使用该软件对数据进行分析和运算时,试试看,数据的处理速度,可谓之:千里江陵~~

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 利用面向对象程序设计技术进行操作系统内核的仿真可以实现作业管理、连续内存管理和页式虚存管理。 作业管理是操作系统内核的重要功能之一,它负责管理系统中多个作业的调度和执行。在面向对象的设计中,可以使用类来表示作业,类中包含作业的属性和方法,如作业ID、作业状态、作业优先级等。通过面向对象的继承和多态性,可以实现不同类型的作业,如批处理作业、交互式作业等。同时,可以使用队列等数据结构来管理作业的调度和执行,实现作业的先来先服务、优先级调度等算法。 连续内存管理是操作系统中的另一个重要功能,它负责管理系统中的物理内存分配和回收。在面向对象的设计中,可以使用类来表示内存块,类中包含内存块的属性和方法,如内存块ID、内存块大小、占用状态等。通过面向对象的封装性和继承性,可以实现内存块的分配、回收和合并等操作。同时,可以使用链表等数据结构来管理内存块的分配和回收,实现连续内存分配的算法,如首次适应算法、最佳适应算法等。 页式虚存管理是操作系统中的一种重要的内存管理方式,它将进程的地址空间划分为固定大小的页,将物理内存划分为对应的物理页框,通过页表进行地址转换。在面向对象的设计中,可以使用类来表示页表和页表项,类中包含页表和页表项的属性和方法,如页表大小、页表项大小、页表项的有效位、页面的读写权限等。通过面向对象的封装性和继承性,可以实现页表项的创建、更新和查询等操作。同时,可以使用哈希表等数据结构来实现页表的快速访问,实现页式虚存管理的算法。 总之,利用面向对象程序设计技术可以很好地实现操作系统内核的作业管理、连续内存管理和页式虚存管理。通过类的设计和数据结构的应用,可以简化系统的实现,增强系统的可维护性和可扩展性。同时,利用面向对象的特性,可以使系统的设计和实现更加灵活和可复用。 ### 回答2: 面向对象程序设计技术是一种软件开发方法,它强调将程序分解为多个独立的对象,并通过对象之间的消息传递来实现系统的功能。利用这种技术可以方便地实现操作系统(OS)内核的作业管理、连续内存管理和页式虚存管理。 作业管理是操作系统中非常重要的一部分,它负责管理和调度各个作业的执行。在利用面向对象程序设计技术仿真作业管理时,可以将每个作业设计为一个独立的对象,包含作业的属性(如优先级、作业状态)和行为(如作业的创建、撤销、调度)。此外,还可以设计一个作业调度器对象,根据不同的调度算法来选择下一个要执行的作业。 连续内存管理是操作系统中负责管理和分配连续内存区域的模块。在利用面向对象程序设计技术仿真连续内存管理时,可以将内存分为多个块,并将每个块设计为一个独立的对象,包含块的属性(如起始地址、大小)和行为(如分配、回收内存)。此外,还可以设计一个内存分配器对象,根据不同的分配算法来选择合适的块进行内存分配。 页式虚存管理是操作系统中负责管理虚拟内存和物理内存之间的映射关系的模块。在利用面向对象程序设计技术仿真页式虚存管理时,可以将虚拟页和物理页设计为独立的对象,并建立虚拟页到物理页的映射关系。每个虚拟页对象可以包含虚拟页的属性(如页号、访问位)和行为(如页面调入、页面置换),每个物理页对象可以包含物理页的属性(如页框号、占用位)和行为(如页面缓存、页面回写)。 通过利用面向对象程序设计技术仿真OS内核的作业管理、连续内存管理和页式虚存管理,可以更好地模拟操作系统的行为和功能,而且对象的独立性和消息传递的机制也能提高系统的灵活性和可扩展性。 ### 回答3: 利用面向对象程序设计技术仿真 OS 内核的作业管理、连续内存管理、页式虚拟存储管理可以通过以下步骤实现。 作业管理是操作系统中的重要组成部分,负责管理和控制用户作业的执行。可以定义一个Job类来表示作业,包含作业名、优先级、状态等属性。通过Job类的创建、调度、挂起、恢复、终止等方法,模拟处理作业的管理。作业管理器可以使用队列来管理所有的作业,通过调度算法选择合适的作业执行。 连续内存管理是操作系统中负责管理内存空间的部分,可以定义一个MemoryManager类来模拟连续内存管理。该类可以包含一个内存块列表,记录每个内存块的起始地址、大小、状态等信息。当有新的作业需要分配内存时,可以通过首次适应算法或最佳适应算法来选择合适的内存块进行分配。当作业完成时,可以释放对应的内存块。 页式虚拟存储管理是操作系统中的一种内存管理技术,可以将进程的逻辑地址空间划分为固定大小的页面,将物理内存划分为同样大小的页框,并通过页表来建立逻辑地址与物理地址之间的映射关系。可以定义一个Page类来表示页,包含页号、页框号等属性。通过页表来记录每个页面对应的页框号。当产生缺页异常时,可以根据页面置换算法来选择适当的页面进行置换。 利用面向对象程序设计技术仿真这些内核管理机制,可以更好地理解并模拟操作系统的内核工作原理。通过合理的类设计、方法调用以及数据结构的应用,可以实现与实际操作系统相似的作业管理、连续内存管理和页式虚拟存储管理,从而更好地理解和掌握操作系统的工作原理和设计思想。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值