已解决 | Linux系统VS code无法打出中文

已解决 | Linux系统VS code无法打出中文

系统:ubuntu 20.04

起初使用的vscode是直接在ubuntu software中直接安装的,因此会出现无法打出中文的bug。

解决方法:

直接在官网中下载.deb自己安装

安装步骤:

官网:https://code.visualstudio.com/
在这里插入图片描述进入.deb文件所在文件夹,运行如下命令安装vs code:

$ dpkg - i ${fileName} // 如dpkg -i code_1.51.1-1605051630_amd64.deb

vscode相关插件推荐在网上有很多,随便搜搜就有了。

  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
文将对 Linux™ 程序员可以使用的内存管理技术进行概述,虽然关注的重点是 C 语言,但同样也适用于其他语言。文中将为您提供如何管理内存的细节,然后将进一步展示如何手工管理内存,如何使用引用计数或者内存池来半手工地管理内存,以及如何使用垃圾收集自动管理内存。 为什么必须管理内存 内存管理是计算机编程最为基本的领域之一。在很多脚本语言中,您不必担心内存是如何管理的,这并不能使得内存管理的重要性有一点点降低。对实际编程来说,理解您的内存管理器的能力与局限性至关重要。在大部分系统语言中,比如 C 和 C++,您必须进行内存管理。本文将介绍手工的、半手工的以及自动的内存管理实践的基本概念。 追溯到在 Apple II 上进行汇编语言编程的时代,那时内存管理还不是个大问题。您实际上在运行整个系统系统有多少内存,您就有多少内存。您甚至不必费心思去弄明白它有多少内存,因为每一台机器的内存数量都相同。所以,如果内存需要非常固定,那么您只需要选择一个内存范围并使用它即可。 不过,即使是在这样一个简单的计算机中,您也会有问题,尤其是当您不知道程序的每个部分将需要多少内存时。如果您的空间有限,而内存需求是变化的,那么您需要一些方法来满足这些需求: 确定您是否有足够的内存来处理数据。 从可用的内存中获取一部分内存。 向可用内存池(pool)中返回部分内存,以使其可以由程序的其他部分或者其他程序使用。 实现这些需求的程序库称为 分配程序(allocators),因为它们负责分配和回收内存。程序的动态性越强,内存管理就越重要,您的内存分配程序的选择也就更重要。让我们来了解可用于内存管理的不同方法,它们的好处与不足,以及它们最适用的情形。 回页首 C 风格的内存分配程序 C 编程语言提供了两个函数来满足我们的三个需求: malloc:该函数分配给定的字节数,并返回一个指向它们的指针。如果没有足够的可用内存,那么它返回一个空指针。 free:该函数获得指向由 malloc 分配的内存片段的指针,并将其释放,以便以后的程序或操作系统使用(实际上,一些 malloc 实现只能将内存归还给程序,而无法将内存归还给操作系统)。 物理内存和虚拟内存 要理解内存在程序中是如何分配的,首先需要理解如何将内存从操作系统分配给程序。计算机上的每一个进程都认为自己可以访问所有的物理内存。显然,由于同时在运行多个程序,所以每个进程不可能拥有全部内存。实际上,这些进程使用的是 虚拟内存。 只是作为一个例子,让我们假定您的程序正在访问地址为 629 的内存。不过,虚拟内存系统不需要将其存储在位置为 629 的 RAM 中。实际上,它甚至可以不在 RAM 中 —— 如果物理 RAM 已经满了,它甚至可能已经被转移到硬盘上!由于这类地址不必反映内存所在的物理位置,所以它们被称为虚拟内存。操作系统维持着一个虚拟地址到物理地址的转换的表,以便计算机硬件可以正确地响应地址请求。并且,如果地址在硬盘上而不是在 RAM 中,那么操作系统将暂时停止您的进程,将其他内存转存到硬盘中,从硬盘上加载被请求的内存,然后再重新启动您的进程。这样,每个进程都获得了自己可以使用的地址空间,可以访问比您物理上安装的内存更多的内存。 在 32-位 x86 系统上,每一个进程可以访问 4 GB 内存。现在,大部分人的系统上并没有 4 GB 内存,即使您将 swap 也算上, 每个进程所使用的内存也肯定少于 4 GB。因此,当加载一个进程时,它会得到一个取决于某个称为 系统中断点(system break)的特定地址的初始内存分配。该地址之后是未被映射的内存 —— 用于在 RAM 或者硬盘中没有分配相应物理位置的内存。因此,如果一个进程运行超出了它初始分配的内存,那么它必须请求操作系统“映射进来(map in)”更多的内存。(映射是一个表示一一对应关系的数学术语 —— 当内存的虚拟地址有一个对应的物理地址来存储内存内容时,该内存将被映射。) 基于 UNIX 的系统有两个可映射到附加内存中的基本系统调用: brk: brk() 是一个非常简单的系统调用。还记得系统中断点吗?该位置是进程映射的内存边界。 brk() 只是简单地将这个位置向前或者向后移动,就可以向进程添加内存或者从进程取走内存。 mmap: mmap(),或者说是“内存映像”,类似于 brk(),但是更为灵活。首先,它可以映射任何位置的内存,而不单单只局限于进程。其次,它不仅可以将虚拟地址映射到物理的 RAM 或者 swap,它还可以将它们映射到文件和文件位置,这样,读写内存将对文件中的数据进行读写。不过,在这里,我们只关心 mmap 向进程添加被映射的内存的能力。 munmap() 所做的事情与 mmap() 相反。 如您所见, brk() 或者 mmap() 都可以用来向我们的进程添加额外的虚拟内存。在我们的例子中将使用 brk(),因为它更简单,更通用。 实现一个简单的分配程序 如果您曾经编写过很多 C 程序,那么您可能曾多次使用过 malloc() 和 free()。不过,您可能没有用一些时间去思考它们在您的操作系统中是如何实现的。本节将向您展示 malloc 和 free 的一个最简化实现的代码,来帮助说明管理内存时都涉及到了哪些事情。 要试着运行这些示例,需要先 复制本代码清单,并将其粘贴到一个名为 malloc.c 的文件中。接下来,我将一次一个部分地对该清单进行解释。 在大部分操作系统中,内存分配由以下两个简单的函数来处理: void *malloc(long numbytes):该函数负责分配 numbytes 大小的内存,并返回指向第一个字节的指针。 void free(void *firstbyte):如果给定一个由先前的 malloc 返回的指针,那么该函数会将分配的空间归还给进程的“空闲空间”。 malloc_init 将是初始化内存分配程序的函数。它要完成以下三件事:将分配程序标识为已经初始化,找到系统中最后一个有效内存地址,然后建立起指向我们管理的内存的指针。这三个变量都是全局变量: 清单 1. 我们的简单分配程序的全局变量 int has_initialized = 0; void *managed_memory_start; void *last_valid_address; 如前所述,被映射的内存的边界(最后一个有效地址)常被称为系统中断点或者 当前中断点。在很多 UNIX® 系统中,为了指出当前系统中断点,必须使用 sbrk(0) 函数。 sbrk 根据参数中给出的字节数移动当前系统中断点,然后返回新的系统中断点。使用参数 0 只是返回当前中断点。这里是我们的 malloc 初始化代码,它将找到当前中断点并初始化我们的变量: 清单 2. 分配程序初始化函数 /* Include the sbrk function */ #include void malloc_init() { /* grab the last valid address from the OS */ last_valid_address = sbrk(0); /* we don't have any memory to manage yet, so *just set the beginning to be last_valid_address */ managed_memory_start = last_valid_address; /* Okay, we're initialized and ready to go */ has_initialized = 1; } 现在,为了完全地管理内存,我们需要能够追踪要分配和回收哪些内存。在对内存块进行了 free 调用之后,我们需要做的是诸如将它们标记为未被使用的等事情,并且,在调用 malloc 时,我们要能够定位未被使用的内存块。因此, malloc 返回的每块内存的起始处首先要有这个结构: 清单 3. 内存控制块结构定义 struct mem_control_block { int is_available; int size; }; 现在,您可能会认为当程序调用 malloc 时这会引发问题 —— 它们如何知道这个结构?答案是它们不必知道;在返回指针之前,我们会将其移动到这个结构之后,把它隐藏起来。这使得返回的指针指向没有用于任何其他用途的内存。那样,从调用程序的角度来看,它们所得到的全部是空闲的、开放的内存。然后,当通过 free() 将该指针传递回来时,我们只需要倒退几个内存字节就可以再次找到这个结构。 在讨论分配内存之前,我们将先讨论释放,因为它更简单。为了释放内存,我们必须要做的惟一一件事情就是,获得我们给出的指针,回退 sizeof(struct mem_control_block) 个字节,并将其标记为可用的。这里是对应的代码: 清单 4. 解除分配函数 void free(void *firstbyte) { struct mem_control_block *mcb; /* Backup from the given pointer to find the * mem_control_block */ mcb = firstbyte - sizeof(struct mem_control_block); /* Mark the block as being available */ mcb->is_available = 1; /* That's It! We're done. */ return; } 如您所见,在这个分配程序中,内存的释放使用了一个非常简单的机制,在固定时间内完成内存释放。分配内存稍微困难一些。以下是该算法的略述: 清单 5. 主分配程序的伪代码 1. If our allocator has not been initialized, initialize it. 2. Add sizeof(struct mem_control_block) to the size requested. 3. start at managed_memory_start. 4. Are we at last_valid address? 5. If we are: A. We didn't find any existing space that was large enough -- ask the operating system for more and return that. 6. Otherwise: A. Is the current space available (check is_available from the mem_control_block)? B. If it is: i) Is it large enough (check "size" from the mem_control_block)? ii) If so: a. Mark it as unavailable b. Move past mem_control_block and return the pointer iii) Otherwise: a. Move forward "size" bytes b. Go back go step 4 C. Otherwise: i) Move forward "size" bytes ii) Go back to step 4 我们主要使用连接的指针遍历内存来寻找开放的内存块。这里是代码: 清单 6. 主分配程序 void *malloc(long numbytes) { /* Holds where we are looking in memory */ void *current_location; /* This is the same as current_location, but cast to a * memory_control_block */ struct mem_control_block *current_location_mcb; /* This is the memory location we will return. It will * be set to 0 until we find something suitable */ void *memory_location; /* Initialize if we haven't already done so */ if(! has_initialized) { malloc_init(); } /* The memory we search for has to include the memory * control block, but the users of malloc don't need * to know this, so we'll just add it in for them. */ numbytes = numbytes + sizeof(struct mem_control_block); /* Set memory_location to 0 until we find a suitable * location */ memory_location = 0; /* Begin searching at the start of managed memory */ current_location = managed_memory_start; /* Keep going until we have searched all allocated space */ while(current_location != last_valid_address) { /* current_location and current_location_mcb point * to the same address. However, current_location_mcb * is of the correct type, so we can use it as a struct. * current_location is a void pointer so we can use it * to calculate addresses. */ current_location_mcb = (struct mem_control_block *)current_location; if(current_location_mcb->is_available) { if(current_location_mcb->size >= numbytes) { /* Woohoo! We've found an open, * appropriately-size location. */ /* It is no longer available */ current_location_mcb->is_available = 0; /* We own it */ memory_location = current_location; /* Leave the loop */ break; } } /* If we made it here, it's because the Current memory * block not suitable; move to the next one */ current_location = current_location + current_location_mcb->size; } /* If we still don't have a valid location, we'll * have to ask the operating system for more memory */ if(! memory_location) { /* Move the program break numbytes further */ sbrk(numbytes); /* The new memory will be where the last valid * address left off */ memory_location = last_valid_address; /* We'll move the last valid address forward * numbytes */ last_valid_address = last_valid_address + numbytes; /* We need to initialize the mem_control_block */ current_location_mcb = memory_location; current_location_mcb->is_available = 0; current_location_mcb->size = numbytes; } /* Now, no matter what (well, except for error conditions), * memory_location has the address of the memory, including * the mem_control_block */ /* Move the pointer past the mem_control_block */ memory_location = memory_location + sizeof(struct mem_control_block); /* Return the pointer */ return memory_location; } 这就是我们的内存管理器。现在,我们只需要构建它,并在程序中使用它即可。 运行下面的命令来构建 malloc 兼容的分配程序(实际上,我们忽略了 realloc() 等一些函数,不过, malloc() 和 free() 才是最主要的函数): 清单 7. 编译分配程序 gcc -shared -fpic malloc.c -o malloc.so 该程序将生成一个名为 malloc.so 的文件,它是一个包含有我们的代码的共享库。 在 UNIX 系统中,现在您可以用您的分配程序来取代系统的 malloc(),做法如下: 清单 8. 替换您的标准的 malloc LD_PRELOAD=/path/to/malloc.so export LD_PRELOAD LD_PRELOAD 环境变量使动态链接器在加载任何可执行程序之前,先加载给定的共享库的符号。它还为特定库中的符号赋予优先权。因此,从现在起,该会话中的任何应用程序都将使用我们的 malloc(),而不是只有系统的应用程序能够使用。有一些应用程序不使用 malloc(),不过它们是例外。其他使用 realloc() 等其他内存管理函数的应用程序,或者错误地假定 malloc() 内部行为的那些应用程序,很可能会崩溃。ash shell 似乎可以使用我们的新 malloc() 很好地工作。 如果您想确保 malloc() 正在被使用,那么您应该通过向函数的入口点添加 write() 调用来进行测试。 我们的内存管理器在很多方面都还存在欠缺,但它可以有效地展示内存管理需要做什么事情。它的某些缺点包括: 由于它对系统中断点(一个全局变量)进行操作,所以它不能与其他分配程序或者 mmap 一起使用。 当分配内存时,在最坏的情形下,它将不得不遍历 全部进程内存;其中可能包括位于硬盘上的很多内存,这意味着操作系统将不得不花时间去向硬盘移入数据和从硬盘中移出数据。 没有很好的内存不足处理方案( malloc 只假定内存分配是成功的)。 它没有实现很多其他的内存函数,比如 realloc()。 由于 sbrk() 可能会交回比我们请求的更多的内存,所以在堆(heap)的末端会遗漏一些内存。 虽然 is_available 标记只包含一位信息,但它要使用完整的 4-字节 的字。 分配程序不是线程安全的。 分配程序不能将空闲空间拼合为更大的内存块。 分配程序的过于简单的匹配算法会导致产生很多潜在的内存碎片。 我确信还有很多其他问题。这就是为什么它只是一个例子! 其他 malloc 实现 malloc() 的实现有很多,这些实现各有优点与缺点。在设计一个分配程序时,要面临许多需要折衷的选择,其中包括: 分配的速度。 回收的速度。 有线程的环境的行为。 内存将要被用光时的行为。 局部缓存。 簿记(Bookkeeping)内存开销。 虚拟内存环境中的行为。 小的或者大的对象。 实时保证。 每一个实现都有其自身的优缺点集合。在我们的简单的分配程序中,分配非常慢,而回收非常快。另外,由于它在使用虚拟内存系统方面较差,所以它最适于处理大的对象。 还有其他许多分配程序可以使用。其中包括: Doug Lea Malloc:Doug Lea Malloc 实际上是完整的一组分配程序,其中包括 Doug Lea 的原始分配程序,GNU libc 分配程序和 ptmalloc。 Doug Lea 的分配程序有着与我们的版本非常类似的基本结构,但是它加入了索引,这使得搜索速度更快,并且可以将多个没有被使用的块组合为一个大的块。它还支持缓存,以便更快地再次使用最近释放的内存。 ptmalloc 是 Doug Lea Malloc 的一个扩展版本,支持多线程。在本文后面的 参考资料部分中,有一篇描述 Doug Lea 的 Malloc 实现的文章。 BSD Malloc:BSD Malloc 是随 4.2 BSD 发行的实现,包含在 FreeBSD 之中,这个分配程序可以从预先确实大小的对象构成的池中分配对象。它有一些用于对象大小的 size 类,这些对象的大小为 2 的若干次幂减去某一常数。所以,如果您请求给定大小的一个对象,它就简单地分配一个与之匹配的 size 类。这样就提供了一个快速的实现,但是可能会浪费内存。在 参考资料部分中,有一篇描述该实现的文章。 Hoard:编写 Hoard 的目标是使内存分配在多线程环境中进行得非常快。因此,它的构造以锁的使用为中心,从而使所有进程不必等待分配内存。它可以显著地加快那些进行很多分配和回收的多线程进程的速度。在 参考资料部分中,有一篇描述该实现的文章。 众多可用的分配程序中最有名的就是上述这些分配程序。如果您的程序有特别的分配需求,那么您可能更愿意编写一个定制的能匹配您的程序内存分配方式的分配程序。不过,如果不熟悉分配程序的设计,那么定制分配程序通常会带来比它们解决的问题更多的问题。要获得关于该主题的适当的介绍,请参阅 Donald Knuth 撰写的 The Art of Computer Programming Volume 1: Fundamental Algorithms 中的第 2.5 节“Dynamic Storage Allocation”(请参阅 参考资料中的链接)。它有点过时,因为它没有考虑虚拟内存环境,不过大部分算法都是基于前面给出的函数。 在 C++ 中,通过重载 operator new(),您可以以每个类或者每个模板为单位实现自己的分配程序。在 Andrei Alexandrescu 撰写的 Modern C++ Design 的第 4 章(“Small Object Allocation”)中,描述了一个小对象分配程序(请参阅 参考资料中的链接)。 基于 malloc() 的内存管理的缺点 不只是我们的内存管理器有缺点,基于 malloc() 的内存管理器仍然也有很多缺点,不管您使用的是哪个分配程序。对于那些需要保持长期存储的程序使用 malloc() 来管理内存可能会非常令人失望。如果您有大量的不固定的内存引用,经常难以知道它们何时被释放。生存期局限于当前函数的内存非常容易管理,但是对于生存期超出该范围的内存来说,管理内存则困难得多。而且,关于内存管理是由进行调用的程序还是由被调用的函数来负责这一问题,很多 API 都不是很明确。 因为管理内存的问题,很多程序倾向于使用它们自己的内存管理规则。C++ 的异常处理使得这项任务更成问题。有时好像致力于管理内存分配和清理的代码比实际完成计算任务的代码还要多!因此,我们将研究内存管理的其他选择。 回页首 半自动内存管理策略 引用计数 引用计数是一种 半自动(semi-automated)的内存管理技术,这表示它需要一些编程支持,但是它不需要您确切知道某一对象何时不再被使用。引用计数机制为您完成内存管理任务。 在引用计数中,所有共享的数据结构都有一个域来包含当前活动“引用”结构的次数。当向一个程序传递一个指向某个数据结构指针时,该程序会将引用计数增加 1。实质上,您是在告诉数据结构,它正在被存储在多少个位置上。然后,当您的进程完成对它的使用后,该程序就会将引用计数减少 1。结束这个动作之后,它还会检查计数是否已经减到零。如果是,那么它将释放内存。 这样做的好处是,您不必追踪程序中某个给定的数据结构可能会遵循的每一条路径。每次对其局部的引用,都将导致计数的适当增加或减少。这样可以防止在使用数据结构时释放该结构。不过,当您使用某个采用引用计数的数据结构时,您必须记得运行引用计数函数。另外,内置函数和第三方的库不会知道或者可以使用您的引用计数机制。引用计数也难以处理发生循环引用的数据结构。 要实现引用计数,您只需要两个函数 —— 一个增加引用计数,一个减少引用计数并当计数减少到零时释放内存。 一个示例引用计数函数集可能看起来如下所示: 清单 9. 基本的引用计数函数 /* Structure Definitions*/ /* Base structure that holds a refcount */ struct refcountedstruct { int refcount; } /* All refcounted structures must mirror struct * refcountedstruct for their first variables */ /* Refcount maintenance functions */ /* Increase reference count */ void REF(void *data) { struct refcountedstruct *rstruct; rstruct = (struct refcountedstruct *) data; rstruct->refcount++; } /* Decrease reference count */ void UNREF(void *data) { struct refcountedstruct *rstruct; rstruct = (struct refcountedstruct *) data; rstruct->refcount--; /* Free the structure if there are no more users */ if(rstruct->refcount == 0) { free(rstruct); } } REF 和 UNREF 可能会更复杂,这取决于您想要做的事情。例如,您可能想要为多线程程序增加锁,那么您可能想扩展 refcountedstruct,使它同样包含一个指向某个在释放内存之前要调用的函数的指针(类似于面向对象语言中的析构函数 —— 如果您的结构中包含这些指针,那么这是 必需的)。 当使用 REF 和 UNREF 时,您需要遵守这些指针的分配规则: UNREF 分配前左端指针(left-hand-side pointer)指向的值。 REF 分配后左端指针(left-hand-side pointer)指向的值。 在传递使用引用计数的结构的函数中,函数需要遵循以下这些规则: 在函数的起始处 REF 每一个指针。 在函数的结束处 UNREF 第一个指针。 以下是一个使用引用计数的生动的代码示例: 清单 10. 使用引用计数的示例 /* EXAMPLES OF USAGE */ /* Data type to be refcounted */ struct mydata { int refcount; /* same as refcountedstruct */ int datafield1; /* Fields specific to this struct */ int datafield2; /* other declarations would go here as appropriate */ }; /* Use the functions in code */ void dosomething(struct mydata *data) { REF(data); /* Process data */ /* when we are through */ UNREF(data); } struct mydata *globalvar1; /* Note that in this one, we don't decrease the * refcount since we are maintaining the reference * past the end of the function call through the * global variable */ void storesomething(struct mydata *data) { REF(data); /* passed as a parameter */ globalvar1 = data; REF(data); /* ref because of Assignment */ UNREF(data); /* Function finished */ } 由于引用计数是如此简单,大部分程序员都自已去实现它,而不是使用库。不过,它们依赖于 malloc 和 free 等低层的分配程序来实际地分配和释放它们的内存。 在 Perl 等高级语言中,进行内存管理时使用引用计数非常广泛。在这些语言中,引用计数由语言自动地处理,所以您根本不必担心它,除非要编写扩展模块。由于所有内容都必须进行引用计数,所以这会对速度产生一些影响,但它极大地提高了编程的安全性和方便性。以下是引用计数的益处: 实现简单。 易于使用。 由于引用是数据结构的一部分,所以它有一个好的缓存位置。 不过,它也有其不足之处: 要求您永远不要忘记调用引用计数函数。 无法释放作为循环数据结构的一部分的结构。 减缓几乎每一个指针的分配。 尽管所使用的对象采用了引用计数,但是当使用异常处理(比如 try 或 setjmp()/ longjmp())时,您必须采取其他方法。 需要额外的内存来处理引用。 引用计数占用了结构中的第一个位置,在大部分机器中最快可以访问到的就是这个位置。 在多线程环境中更慢也更难以使用。 C++ 可以通过使用 智能指针(smart pointers)来容忍程序员所犯的一些错误,智能指针可以为您处理引用计数等指针处理细节。不过,如果不得不使用任何先前的不能处理智能指针的代码(比如对 C 库的联接),实际上,使用它们的后果通实比不使用它们更为困难和复杂。因此,它通常只是有益于纯 C++ 项目。如果您想使用智能指针,那么您实在应该去阅读 Alexandrescu 撰写的 Modern C++ Design 一书中的“Smart Pointers”那一章。 内存池 内存池是另一种半自动内存管理方法。内存池帮助某些程序进行自动内存管理,这些程序会经历一些特定的阶段,而且每个阶段中都有分配给进程的特定阶段的内存。例如,很多网络服务器进程都会分配很多针对每个连接的内存 —— 内存的最大生存期限为当前连接的存在期。Apache 使用了池式内存(pooled memory),将其连接拆分为各个阶段,每个阶段都有自己的内存池。在结束每个阶段时,会一次释放所有内存。 在池式内存管理中,每次内存分配都会指定内存池,从中分配内存。每个内存池都有不同的生存期限。在 Apache 中,有一个持续时间为服务器存在期的内存池,还有一个持续时间为连接的存在期的内存池,以及一个持续时间为请求的存在期的池,另外还有其他一些内存池。因此,如果我的一系列函数不会生成比连接持续时间更长的数据,那么我就可以完全从连接池中分配内存,并知道在连接结束时,这些内存会被自动释放。另外,有一些实现允许注册 清除函数(cleanup functions),在清除内存池之前,恰好可以调用它,来完成在内存被清理前需要完成的其他所有任务(类似于面向对象中的析构函数)。 要在自己的程序中使用池,您既可以使用 GNU libc 的 obstack 实现,也可以使用 Apache 的 Apache Portable Runtime。GNU obstack 的好处在于,基于 GNU 的 Linux 发行版本中默认会包括它们。Apache Portable Runtime 的好处在于它有很多其他工具,可以处理编写多平台服务器软件所有方面的事情。要深入了解 GNU obstack 和 Apache 的池式内存实现,请参阅 参考资料部分中指向这些实现的文档的链接。 下面的假想代码列表展示了如何使用 obstack: 清单 11. obstack 的示例代码 #include #include /* Example code listing for using obstacks */ /* Used for obstack macros (xmalloc is a malloc function that exits if memory is exhausted */ #define obstack_chunk_alloc xmalloc #define obstack_chunk_free free /* Pools */ /* Only permanent allocations should go in this pool */ struct obstack *global_pool; /* This pool is for per-connection data */ struct obstack *connection_pool; /* This pool is for per-request data */ struct obstack *request_pool; void allocation_failed() { exit(1); } int main() { /* Initialize Pools */ global_pool = (struct obstack *) xmalloc (sizeof (struct obstack)); obstack_init(global_pool); connection_pool = (struct obstack *) xmalloc (sizeof (struct obstack)); obstack_init(connection_pool); request_pool = (struct obstack *) xmalloc (sizeof (struct obstack)); obstack_init(request_pool); /* Set the error handling function */ obstack_alloc_failed_handler = &allocation_failed; /* Server main loop */ while(1) { wait_for_connection(); /* We are in a connection */ while(more_requests_available()) { /* Handle request */ handle_request(); /* Free all of the memory allocated * in the request pool */ obstack_free(request_pool, NULL); } /* We're finished with the connection, time * to free that pool */ obstack_free(connection_pool, NULL); } } int handle_request() { /* Be sure that all object allocations are allocated * from the request pool */ int bytes_i_need = 400; void *data1 = obstack_alloc(request_pool, bytes_i_need); /* Do stuff to process the request */ /* return */ return 0; } 基本上,在操作的每一个主要阶段结束之后,这个阶段的 obstack 会被释放。不过,要注意的是,如果一个过程需要分配持续时间比当前阶段更长的内存,那么它也可以使用更长期限的 obstack,比如连接或者全局内存。传递给 obstack_free() 的 NULL 指出它应该释放 obstack 的全部内容。可以用其他的值,但是它们通常不怎么实用。 使用池式内存分配的益处如下所示: 应用程序可以简单地管理内存。 内存分配和回收更快,因为每次都是在一个池中完成的。分配可以在 O(1) 时间内完成,释放内存池所需时间也差不多(实际上是 O(n) 时间,不过在大部分情况下会除以一个大的因数,使其变成 O(1))。 可以预先分配错误处理池(Error-handling pools),以便程序在常规内存被耗尽时仍可以恢复。 有非常易于使用的标准实现。 池式内存的缺点是: 内存池只适用于操作可以分阶段的程序。 内存池通常不能与第三方库很好地合作。 如果程序的结构发生变化,则不得不修改内存池,这可能会导致内存管理系统的重新设计。 您必须记住需要从哪个池进行分配。另外,如果在这里出错,就很难捕获该内存池。 回页首 垃圾收集 垃圾收集(Garbage collection)是全自动地检测并移除不再使用的数据对象。垃圾收集器通常会在当可用内存减少到少于一个具体的阈值时运行。通常,它们以程序所知的可用的一组“基本”数据 —— 栈数据、全局变量、寄存器 —— 作为出发点。然后它们尝试去追踪通过这些数据连接到每一块数据。收集器找到的都是有用的数据;它没有找到的就是垃圾,可以被销毁并重新使用这些无用的数据。为了有效地管理内存,很多类型的垃圾收集器都需要知道数据结构内部指针的规划,所以,为了正确运行垃圾收集器,它们必须是语言本身的一部分。 收集器的类型 复制(copying): 这些收集器将内存存储器分为两部分,只允许数据驻留在其中一部分上。它们定时地从“基本”的元素开始将数据从一部分复制到另一部分。内存新近被占用的部分现在成为活动的,另一部分上的所有内容都认为是垃圾。另外,当进行这项复制操作时,所有指针都必须被更新为指向每个内存条目的新位置。因此,为使用这种垃圾收集方法,垃圾收集器必须与编程语言集成在一起。 标记并清理(Mark and sweep):每一块数据都被加上一个标签。不定期的,所有标签都被设置为 0,收集器从“基本”的元素开始遍历数据。当它遇到内存时,就将标签标记为 1。最后没有被标记为 1 的所有内容都认为是垃圾,以后分配内存时会重新使用它们。 增量的(Incremental):增量垃圾收集器不需要遍历全部数据对象。因为在收集期间的突然等待,也因为与访问所有当前数据相关的缓存问题(所有内容都不得不被页入(page-in)),遍历所有内存会引发问题。增量收集器避免了这些问题。 保守的(Conservative):保守的垃圾收集器在管理内存时不需要知道与数据结构相关的任何信息。它们只查看所有数据类型,并假定它们 可以全部都是指针。所以,如果一个字节序列可以是一个指向一块被分配的内存的指针,那么收集器就将其标记为正在被引用。有时没有被引用的内存会被收集,这样会引发问题,例如,如果一个整数域中包含一个值,该值是已分配内存的地址。不过,这种情况极少发生,而且它只会浪费少量内存。保守的收集器的优势是,它们可以与任何编程语言相集成。 Hans Boehm 的保守垃圾收集器是可用的最流行的垃圾收集器之一,因为它是免费的,而且既是保守的又是增量的,可以使用 --enable-redirect-malloc 选项来构建它,并且可以将它用作系统分配程序的简易替代者(drop-in replacement)(用 malloc/ free 代替它自己的 API)。实际上,如果这样做,您就可以使用与我们在示例分配程序中所使用的相同的 LD_PRELOAD 技巧,在系统上的几乎任何程序中启用垃圾收集。如果您怀疑某个程序正在泄漏内存,那么您可以使用这个垃圾收集器来控制进程。在早期,当 Mozilla 严重地泄漏内存时,很多人在其中使用了这项技术。这种垃圾收集器既可以在 Windows® 下运行,也可以在 UNIX 下运行。 垃圾收集的一些优点: 您永远不必担心内存的双重释放或者对象的生命周期。 使用某些收集器,您可以使用与常规分配相同的 API。 其缺点包括: 使用大部分收集器时,您都无法干涉何时释放内存。 在多数情况下,垃圾收集比其他形式的内存管理更慢。 垃圾收集错误引发的缺陷难于调试。 如果您忘记将不再使用的指针设置为 null,那么仍然会有内存泄漏。 回页首 结束语 一切都需要折衷:性能、易用、易于实现、支持线程的能力等,这里只列出了其中的一些。为了满足项目的要求,有很多内存管理模式可以供您使用。每种模式都有大量的实现,各有其优缺点。对很多项目来说,使用编程环境默认的技术就足够了,不过,当您的项目有特殊的需要时,了解可用的选择将会有帮助。下表对比了本文中涉及的内存管理策略。 表 1. 内存分配策略的对比 策略 分配速度 回收速度 局部缓存 易用性 通用性 实时可用 SMP 线程友好 定制分配程序 取决于实现 取决于实现 取决于实现 很难 无 取决于实现 取决于实现 简单分配程序 内存使用少时较快 很快 差 容易 高 否 否 GNU malloc 中 快 中 容易 高 否 中 Hoard 中 中 中 容易 高 否 是 引用计数 N/A N/A 非常好 中 中 是(取决于 malloc 实现) 取决于实现 池 中 非常快 极好 中 中 是(取决于 malloc 实现) 取决于实现 垃圾收集 中(进行收集时慢) 中 差 中 中 否 几乎不 增量垃圾收集 中 中 中 中 中 否 几乎不 增量保守垃圾收集 中 中 中 容易 高 否 几乎不 参考资料 您可以参阅本文在 developerWorks 全球站点上的 英文原文。 Web 上的文档 GNU C Library 手册的 obstacks 部分 提供了 obstacks 编程接口。 Apache Portable Runtime 文档 描述了它们的池式分配程序的接口。 基本的分配程序 Doug Lea 的 Malloc 是最流行的内存分配程序之一。 BSD Malloc 用于大部分基于 BSD 的系统中。 ptmalloc 起源于 Doug Lea 的 malloc,用于 GLIBC 之中。 Hoard 是一个为多线程应用程序优化的 malloc 实现。 GNU Memory-Mapped Malloc(GDB 的组成部分) 是一个基于 mmap() 的 malloc 实现。 池式分配程序 GNU Obstacks(GNU Libc 的组成部分)是安装最多的池式分配程序,因为在每一个基于 glibc 的系统中都有它。 Apache 的池式分配程序(Apache Portable Runtime 中) 是应用最为广泛的池式分配程序。 Squid 有其自己的池式分配程序。 NetBSD 也有其自己的池式分配程序。 talloc 是一个池式分配程序,是 Samba 的组成部分。 智能指针和定制分配程序 Loki C++ Library 有很多为 C++ 实现的通用模式,包括智能指针和一个定制的小对象分配程序。 垃圾收集器 Hahns Boehm Conservative Garbage Collector 是最流行的开源垃圾收集器,它可以用于常规的 C/C++ 程序。 关于现代操作系统中的虚拟内存的文章 Marshall Kirk McKusick 和 Michael J. Karels 合著的 A New Virtual Memory Implementation for Berkeley UNIX 讨论了 BSD 的 VM 系统。 Mel Gorman's Linux VM Documentation 讨论了 Linux VM 系统。 关于 malloc 的文章 Poul-Henning Kamp 撰写的 Malloc in Modern Virtual Memory Environments 讨论的是 malloc 以及它如何与 BSD 虚拟内存交互。 Berger、McKinley、Blumofe 和 Wilson 合著的 Hoard -- a Scalable Memory Allocator for Multithreaded Environments 讨论了 Hoard 分配程序的实现。 Marshall Kirk McKusick 和 Michael J. Karels 合著的 Design of a General Purpose Memory Allocator for the 4.3BSD UNIX Kernel 讨论了内核级的分配程序。 Doug Lea 撰写的 A Memory Allocator 给出了一个关于设计和实现分配程序的概述,其中包括设计选择与折衷。 Emery D. Berger 撰写的 Memory Management for High-Performance Applications 讨论的是定制内存管理以及它如何影响高性能应用程序。 关于定制分配程序的文章 Doug Lea 撰写的 Some Storage Management Techniques for Container Classes 描述的是为 C++ 类编写定制分配程序。 Berger、Zorn 和 McKinley 合著的 Composing High-Performance Memory Allocators 讨论了如何编写定制分配程序来加快具体工作的速度。 Berger、Zorn 和 McKinley 合著的 Reconsidering Custom Memory Allocation 再次提及了定制分配的主题,看是否真正值得为其费心。 关于垃圾收集的文章 Paul R. Wilson 撰写的 Uniprocessor Garbage Collection Techniques 给出了垃圾收集的一个基本概述。 Benjamin Zorn 撰写的 The Measured Cost of Garbage Collection 给出了关于垃圾收集和性能的硬数据(hard data)。 Hans-Juergen Boehm 撰写的 Memory Allocation Myths and Half-Truths 给出了关于垃圾收集的神话(myths)。 Hans-Juergen Boehm 撰写的 Space Efficient Conservative Garbage Collection 是一篇描述他的用于 C/C++ 的垃圾收集器的文章。 Web 上的通用参考资料 内存管理参考 中有很多关于内存管理参考资料和技术文章的链接。 关于内存管理和内存层级的 OOPS Group Papers 是非常好的一组关于此主题的技术文章。 C++ 中的内存管理讨论的是为 C++ 编写定制的分配程序。 Programming Alternatives: Memory Management 讨论了程序员进行内存管理时的一些选择。 垃圾收集 FAQ 讨论了关于垃圾收集您需要了解的所有内容。 Richard Jones 的 Garbage Collection Bibliography 有指向任何您想要的关于垃圾收集的文章的链接。 书籍 Michael Daconta 撰写的 C++ Pointers and Dynamic Memory Management 介绍了关于内存管理的很多技术。 Frantisek Franek 撰写的 Memory as a Programming Concept in C and C++ 讨论了有效使用内存的技术与工具,并给出了在计算机编程中应当引起注意的内存相关错误的角色。 Richard Jones 和 Rafael Lins 合著的 Garbage Collection: Algorithms for Automatic Dynamic Memory Management 描述了当前使用的最常见的垃圾收集算法。 在 Donald Knuth 撰写的 The Art of Computer Programming 第 1 卷 Fundamental Algorithms 的第 2.5 节“Dynamic Storage Allocation”中,描述了实现基本的分配程序的一些技术。 在 Donald Knuth 撰写的 The Art of Computer Programming 第 1 卷 Fundamental Algorithms 的第 2.3.5 节“Lists and Garbage Collection”中,讨论了用于列表的垃圾收集算法。 Andrei Alexandrescu 撰写的 Modern C++ Design 第 4 章“Small Object Allocation”描述了一个比 C++ 标准分配程序效率高得多的一个高速小对象分配程序。 Andrei Alexandrescu 撰写的 Modern C++ Design 第 7 章“Smart Pointers”描述了在 C++ 中智能指针的实现。 Jonathan 撰写的 Programming from the Ground Up 第 8 章“Intermediate Memory Topics”中有本文使用的简单分配程序的一个汇编语言版本。 来自 developerWorks 自我管理数据缓冲区内存 (developerWorks,2004 年 1 月)略述了一个用于管理内存的自管理的抽象数据缓存器的伪 C (pseudo-C)实现。 A framework for the user defined malloc replacement feature (developerWorks,2002 年 2 月)展示了如何利用 AIX 中的一个工具,使用自己设计的内存子系统取代原有的内存子系统。 掌握 Linux 调试技术 (developerWorks,2002 年 8 月)描述了可以使用调试方法的 4 种不同情形:段错误、内存溢出、内存泄漏和挂起。 在 处理 Java 程序中的内存漏洞 (developerWorks,2001 年 2 月)中,了解导致 Java 内存泄漏的原因,以及何时需要考虑它们。 在 developerWorks Linux 专区中,可以找到更多为 Linux 开发人员准备的参考资料。 从 developerWorks 的 Speed-start your Linux app 专区中,可以下载运行于 Linux 之上的 IBM 中间件产品的免费测试版本,其中包括 WebSphere® Studio Application Developer、WebSphere Application Server、DB2® Universal Database、Tivoli® Access Manager 和 Tivoli Directory Server,查找 how-to 文章和技术支持。 通过参与 developerWorks blogs 加入到 developerWorks 社区。 可以在 Developer Bookstore Linux 专栏中定购 打折出售的 Linux 书籍。 关于作者 Jonathan Bartlett 是 Programming from the Ground Up 一书的作者,这本书介绍的是 Linux 汇编语言编程。Jonathan Bartlett 是 New Media Worx 的总开发师,负责为客户开发 Web、视频、kiosk 和桌面应用程序。您可以通过 [email protected] 与 Jonathan 联系。
目录树 下面再给个样例 ├─Makefile │ ├─boot │ bootsect.s │ head.s │ setup.s │ ├─fs │ bitmap.c │ block_dev.c │ buffer.c │ char_dev.c │ exec.c │ fcntl.c │ file_dev.c │ file_table.c │ inode.c │ ioctl.c │ Makefile │ namei.c │ open.c │ pipe.c │ read_write.c │ stat.c │ super.c │ truncate.c │ ├─include │ │ a.out.h │ │ const.h │ │ ctype.h │ │ errno.h │ │ fcntl.h │ │ signal.h │ │ stdarg.h │ │ stddef.h │ │ string.h │ │ termios.h │ │ time.h │ │ unistd.h │ │ utime.h │ │ │ ├─asm │ │ io.h │ │ memory.h │ │ segment.h │ │ system.h │ │ │ ├─linux │ │ config.h │ │ fs.h │ │ hdreg.h │ │ head.h │ │ kernel.h │ │ mm.h │ │ sched.h │ │ sys.h │ │ tty.h │ │ │ └─sys │ stat.h │ times.h │ types.h │ utsname.h │ wait.h │ ├─init │ main.c │ ├─kernel │ │ asm.s │ │ exit.c │ │ fork.c │ │ mktime.c │ │ panic.c │ │ printk.c │ │ sched.c │ │ signal.c │ │ sys.c │ │ system_call.s │ │ vsprintf.c │ │ │ ├─blk_drv │ │ blk.h │ │ floppy.c │ │ hd.c │ │ ll_rw_blk.c │ │ Makefile │ │ ramdisk.c │ │ │ ├─chr_drv │ │ console.c │ │ keyboard.S │ │ Makefile │ │ rs_io.s │ │ serial.c │ │ tty_io.c │ │ tty_ioctl.c │ │ │ └─math │ Makefile │ math_emulate. │ ├─lib │ close.c │ ctype.c │ dup.c │ errno.c │ execve.c │ Makefile │ malloc.c │ open.c │ setsid.c │ string.c │ wait.c │ write.c │ _exit.c │ ├─mm │ Makefile │ memory.c │ page.s │ └─tools build.c 样例 main。c 用sourceinsight软件阅读 很方便 /* * linux/init/main.c * * (C) 1991 Linus Torvalds */ #define __LIBRARY__ // 定义该变量是为了包括定义在unistd.h 中的内嵌汇编代码等信息。 #include // *.h 头文件所在的默认目录是include/,则在代码中就不用明确指明位置。 // 如果不是UNIX 的标准头文件,则需要指明所在的目录,并用双引号括住。 // 标准符号常数与类型文件。定义了各种符号常数和类型,并申明了各种函数。 // 如果定义了__LIBRARY__,则还包括系统调用号和内嵌汇编代码_syscall0()等。 #include // 时间类型头文件。其中最主要定义了tm 结构和一些有关时间的函数原形。 /* * we need this inline - forking from kernel space will result * in NO COPY ON WRITE (!!!), until an execve is executed. This * is no problem, but for the stack. This is handled by not letting * main() use the stack at all after fork(). Thus, no function * calls - which means inline code for fork too, as otherwise we * would use the stack upon exit from 'fork()'. * * Actually only pause and fork are needed inline, so that there * won't be any messing with the stack from main(), but we define * some others too. */ /* * 我们需要下面这些内嵌语句 - 从内核空间创建进程(forking)将导致没有写时复制(COPY ON WRITE)!!! * 直到一个执行execve 调用。这对堆栈可能带来问题。处理的方法是在fork()调用之后不让main()使用 * 任何堆栈。因此就不能有函数调用 - 这意味着fork 也要使用内嵌的代码,否则我们在从fork()退出 * 时就要使用堆栈了。 * 实际上只有pause 和fork 需要使用内嵌方式,以保证从main()中不会弄乱堆栈,但是我们同时还 * 定义了其它一些函数。 */ static inline _syscall0 (int, fork) // 是unistd.h 中的内嵌宏代码。以嵌入汇编的形式调用 // Linux系统调用中断0x80。该中断是所有系统调用的 // 入口。该条语句实际上是int fork()创建进程系统调用。 // syscall0 名称中最后的0 表示无参数,1 表示1 个参数。 static inline _syscall0 (int, pause) // int pause()系统调用:暂停进程的执行,直到 // 收到一个信号。 static inline _syscall1 (int, setup, void *, BIOS) // int setup(void * BIOS)系统调用,仅用于 // linux 初始化(仅在这个程序中被调用)。 static inline _syscall0 (int, sync) // int sync()系统调用:更新文件系统。 #include // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。 #include // 调度程序头文件,定义了任务结构task_struct、第1 个初始任务 // 的数据。还有一些以宏的形式定义的有关描述符参数设置和获取的 // 嵌入式汇编函数程序。 #include // head 头文件,定义了段描述符的简单结构,和几个选择符常量。 #include // 系统头文件。以宏的形式定义了许多有关设置或修改 // 描述符/中断门等的嵌入式汇编子程序。 #include // io 头文件。以宏的嵌入汇编程序形式定义对io 端口操作的函数。 #include // 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。 #include // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个 // 类型(va_list)和三个宏(va_start, va_arg 和va_end),vsprintf、 // vprintf、vfprintf。 #include #include // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。 #include // 类型头文件。定义了基本的系统数据类型。 #include // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。 static char printbuf[1024]; // 静态字符串数组。 extern int vsprintf (); // 送格式化输出到一字符串中(在kernel/vsprintf.c,92 行)。 extern void init (void); // 函数原形,初始化(在168 行)。 extern void blk_dev_init (void); // 块设备初始化子程序(kernel/blk_drv/ll_rw_blk.c,157 行) extern void chr_dev_init (void); // 字符设备初始化(kernel/chr_drv/tty_io.c, 347 行) extern void hd_init (void); // 硬盘初始化程序(kernel/blk_drv/hd.c, 343 行) extern void floppy_init (void); // 软驱初始化程序(kernel/blk_drv/floppy.c, 457 行) extern void mem_init (long start, long end); // 内存管理初始化(mm/memory.c, 399 行) extern long rd_init (long mem_start, int length); //虚拟盘初始化(kernel/blk_drv/ramdisk.c,52) extern long kernel_mktime (struct tm *tm); // 建立内核时间(秒)。 extern long startup_time; // 内核启动时间(开机时间)(秒)。 /* * This is set up by the setup-routine at boot-time */ /* * 以下这些数据是由setup.s 程序在引导时间设置的(参见第2 章2.3.1 节中的表2.1)。 */ #define EXT_MEM_K (*(unsigned short *)0x90002) // 1M 以后的扩展内存大小(KB)。 #define DRIVE_INFO (*(struct drive_info *)0x90080) // 硬盘参数表基址。 #define ORIG_ROOT_DEV (*(unsigned short *)0x901FC) // 根文件系统所在设备号。 /* * Yeah, yeah, it's ugly, but I cannot find how to do this correctly * and this seems to work. I anybody has more info on the real-time * clock I'd be interested. Most of this was trial and error, and some * bios-listing reading. Urghh. */ /* * 是啊,是啊,下面这段程序很差劲,但我不知道如何正确地实现,而且好象它还能运行。如果有 * 关于实时时钟更多的资料,那我很感兴趣。这些都是试探出来的,以及看了一些bios 程序,呵! */ #define CMOS_READ(addr) ({ \ // 这段宏读取CMOS 实时时钟信息。 outb_p (0x80 | addr, 0x70); \ // 0x70 是写端口号,0x80|addr 是要读取的CMOS 内存地址。 inb_p (0x71); \ // 0x71 是读端口号。 } ) #define BCD_TO_BIN(val) ((val)=((val)&15) + ((val)>>4)*10) // 将BCD 码转换成数字。 static void time_init (void) // 该子程序取CMOS 时钟,并设置开机时间??startup_time(秒)。 { struct tm time; do { time.tm_sec = CMOS_READ (0); // 参见后面CMOS 内存列表。 time.tm_min = CMOS_READ (2); time.tm_hour = CMOS_READ (4); time.tm_mday = CMOS_READ (7); time.tm_mon = CMOS_READ (8); time.tm_year = CMOS_READ (9); } while (time.tm_sec != CMOS_READ (0)); BCD_TO_BIN (time.tm_sec); BCD_TO_BIN (time.tm_min); BCD_TO_BIN (time.tm_hour); BCD_TO_BIN (time.tm_mday); BCD_TO_BIN (time.tm_mon); BCD_TO_BIN (time.tm_year); time.tm_mon--; startup_time = kernel_mktime (&time); } static long memory_end = 0; // 机器具有的内存(字节数)。 static long buffer_memory_end = 0; // 高速缓冲区末端地址。 static long main_memory_start = 0; // 主内存(将用于分页)开始的位置。 struct drive_info { char dummy[32]; } drive_info; // 用于存放硬盘参数表信息。 void main (void) /* This really IS void, no error here. */ { /* The startup routine assumes (well, ...) this */ /* 这里确实是void,并没错。在startup 程序(head.s)中就是这样假设的。 */ // 参见head.s 程序第136 行开始的几行代码。 /* * Interrupts are still disabled. Do necessary setups, then * enable them */ /* * 此时中断仍被禁止着,做完必要的设置后就将其开启。 */ // 下面这段代码用于保存: // 根设备号 ??ROOT_DEV; 高速缓存末端地址??buffer_memory_end; // 机器内存数??memory_end;主内存开始地址 ??main_memory_start; ROOT_DEV = ORIG_ROOT_DEV; drive_info = DRIVE_INFO; memory_end = (1 << 20) + (EXT_MEM_K < 16 * 1024 * 1024) // 如果内存超过16Mb,则按16Mb 计。 memory_end = 16 * 1024 * 1024; if (memory_end > 12 * 1024 * 1024) // 如果内存>12Mb,则设置缓冲区末端=4Mb buffer_memory_end = 4 * 1024 * 1024; else if (memory_end > 6 * 1024 * 1024) // 否则如果内存>6Mb,则设置缓冲区末端=2Mb buffer_memory_end = 2 * 1024 * 1024; else buffer_memory_end = 1 * 1024 * 1024; // 否则则设置缓冲区末端=1Mb main_memory_start = buffer_memory_end; // 主内存起始位置=缓冲区末端; #ifdef RAMDISK // 如果定义了虚拟盘,则主内存将减少。 main_memory_start += rd_init (main_memory_start, RAMDISK * 1024); #endif // 以下是内核进行所有方面的初始化工作。阅读时最好跟着调用的程序深入进去看,实在看 // 不下去了,就先放一放,看下一个初始化调用 -- 这是经验之谈?。 mem_init (main_memory_start, memory_end); trap_init (); // 陷阱门(硬件中断向量)初始化。(kernel/traps.c,181 行) blk_dev_init (); // 块设备初始化。 (kernel/blk_dev/ll_rw_blk.c,157 行) chr_dev_init (); // 字符设备初始化。 (kernel/chr_dev/tty_io.c,347 行) tty_init (); // tty 初始化。 (kernel/chr_dev/tty_io.c,105 行) time_init (); // 设置开机启动时间??startup_time(见76 行)。 sched_init (); // 调度程序初始化(加载了任务0 的tr, ldtr) (kernel/sched.c,385) buffer_init (buffer_memory_end); // 缓冲管理初始化,建内存链表等。(fs/buffer.c,348) hd_init (); // 硬盘初始化。 (kernel/blk_dev/hd.c,343 行) floppy_init (); // 软驱初始化。 (kernel/blk_dev/floppy.c,457 行) sti (); // 所有初始化工作都做完了,开启中断。 // 下面过程通过在堆栈中设置的参数,利用中断返回指令切换到任务0。 move_to_user_mode (); // 移到用户模式。 (include/asm/system.h,第1 行) if (!fork ()) { /* we count on this going ok */ init (); } /* * NOTE!! For any other task 'pause()' would mean we have to get a * signal to awaken, but task0 is the sole exception (see 'schedule()') * as task 0 gets activated at every idle moment (when no other tasks * can run). For task0 'pause()' just means we go check if some other * task can run, and if not we return here. */ /* 注意!! 对于任何其它的任务,'pause()'将意味着我们必须等待收到一个信号才会返 * 回就绪运行态,但任务0(task0)是唯一的意外情况(参见'schedule()'),因为任务0 在 * 任何空闲时间里都会被激活(当没有其它任务在运行时),因此对于任务0'pause()'仅意味着 * 我们返回来查看是否有其它任务可以运行,如果没有的话我们就回到这里,一直循环执行'pause()'。 */ for (;;) pause (); } static int printf (const char *fmt, ...) // 产生格式化信息并输出到标准输出设备stdout(1),这里是指屏幕上显示。参数'*fmt'指定输出将 // 采用的格式,参见各种标准C 语言书籍。该子程序正好是vsprintf 如何使用的一个例子。 // 该程序使用vsprintf()将格式化的字符串放入printbuf 缓冲区,然后用write()将缓冲区的内容 // 输出到标准设备(1--stdout)。 { va_list args; int i; va_start (args, fmt); write (1, printbuf, i = vsprintf (printbuf, fmt, args)); va_end (args); return i; } static char *argv_rc[] = { "/bin/sh", NULL}; // 调用执行程序时参数的字符串数组。 static char *envp_rc[] = { "HOME=/", NULL}; // 调用执行程序时的环境字符串数组。 static char *argv[] = { "-/bin/sh", NULL}; // 同上。 static char *envp[] = { "HOME=/usr/root", NULL}; void init (void) { int pid, i; // 读取硬盘参数包括分区表信息并建立虚拟盘和安装根文件系统设备。 // 该函数是在25 行上的宏定义的,对应函数是sys_setup(),在kernel/blk_drv/hd.c,71 行。 setup ((void *) &drive_info); (void) open ("/dev/tty0", O_RDWR, 0); // 用读写访问方式打开设备“/dev/tty0”, // 这里对应终端控制台。 // 返回的句柄号0 -- stdin 标准输入设备。 (void) dup (0); // 复制句柄,产生句柄1 号 -- stdout 标准输出设备。 (void) dup (0); // 复制句柄,产生句柄2 号 -- stderr 标准出错输出设备。 printf ("%d buffers = %d bytes buffer space\n\r", NR_BUFFERS, NR_BUFFERS * BLOCK_SIZE); // 打印缓冲区块数和总字节数,每块1024 字节。 printf ("Free mem: %d bytes\n\r", memory_end - main_memory_start); //空闲内存字节数。 // 下面fork()用于创建一个子进程(子任务)。对于被创建的子进程,fork()将返回0 值, // 对于原(父进程)将返回子进程的进程号。所以180-184 句是子进程执行的内容。该子进程 // 关闭了句柄0(stdin),以只读方式打开/etc/rc 文件,并执行/bin/sh 程序,所带参数和 // 环境变量分别由argv_rc 和envp_rc 数组给出。参见后面的描述。 if (!(pid = fork ())) { close (0); if (open ("/etc/rc", O_RDONLY, 0)) _exit (1); // 如果打开文件失败,则退出(/lib/_exit.c,10)。 execve ("/bin/sh", argv_rc, envp_rc); // 装入/bin/sh 程序并执行。 _exit (2); // 若execve()执行失败则退出(出错码2,“文件或目录不存在”)。 } // 下面是父进程执行的语句。wait()是等待子进程停止或终止,其返回值应是子进程的进程号(pid)。 // 这三句的作用是父进程等待子进程的结束。&i 是存放返回状态信息的位置。如果wait()返回值不 // 等于子进程号,则继续等待。 if (pid > 0) while (pid != wait (&i)) /* nothing */ ; // 如果执行到这里,说明刚创建的子进程的执行已停止或终止了。下面循环中首先再创建一个子进程, // 如果出错,则显示“初始化程序创建子进程失败”的信息并继续执行。对于所创建的子进程关闭所有 // 以前还遗留的句柄(stdin, stdout, stderr),新创建一个会话并设置进程组号,然后重新打开 // /dev/tty0 作为stdin,并复制成stdout 和stderr。再次执行系统解释程序/bin/sh。但这次执行所 // 选用的参数和环境数组另选了一套(见上面165-167 行)。然后父进程再次运行wait()等待。如果 // 子进程又停止了执行,则在标准输出上显示出错信息“子进程pid 停止了运行,返回码是i”,然后 // 继续重试下去…,形成“大”死循环。 while (1) { if ((pid = fork ()) < 0) { printf ("Fork failed in init\r\n"); continue; } if (!pid) { close (0); close (1); close (2); setsid (); (void) open ("/dev/tty0", O_RDWR, 0); (void) dup (0); (void) dup (0); _exit (execve ("/bin/sh", argv, envp)); } while (1) if (pid == wait (&i)) break; printf ("\n\rchild %d died with code %04x\n\r", pid, i); sync (); } _exit (0); /* NOTE! _exit, not exit() */ }
TinyXML是一个简单小巧,可以很容易集成到其它程序中的C++ XML解析器。 它能做些什么 简单地说,TinyXML解析一个XML文档并由此生成一个可读可修改可保存的文档对象模型(DOM)。 XML的意思是“可扩展标记语言“(eXtensible Markup Language)。它允许你创建你自己的文档标记。在为浏览器标记文档方面HTML做得很好,然而XML允许你定义任何文档标记,比如可以为一个组织者应用程序定义一个描述“to do”列表的文档。 XML拥有一个结构化并且方便的格式,所有为存储应用程序数据而创建的随机文件格式都可以用XML代替,而这一切只需要一个解析器。 最全面正确的说明可以在http://www.w3.org/TR/2004/REC-xml-20040204/找到,但坦白地说,它很晦涩难懂。事实上我喜欢http://skew.org/xml/tutorial上关于XML的介绍。 有不同的方法可以访问和与XML数据进行交互。TinyXML使用文档对象模型(DOM),这意味着XML数据被解析成一个可被浏览和操作的C++对象,然后它可以被写到磁盘或者另一个输出流中。你也可以把C++对象构造成一个XML文档然后把它写到磁盘或者另一个输出流中。 TinyXML被设计得容易快速上手。它只有两个头文件和四个cpp文件。只需要把它们简单地加到你的项目中就行了。有一个例子文件——xmltest.cpp来引导你该怎么做。 TinyXML以Zlib许可来发布,所以你可以在开源或者商业软件中使用它。许可证更具体的描述在每个源代码文件的顶部可以找到。 TinyXML在保证正确和恰当的XML输出的基础上尝试成为一个灵活的解析器。TinyXML可以在任何合理的C++适用系统上编译。它不依赖于异常或者运行时类型信息,有没有STL支持都可以编译。TinyXML完全支持UTF-8编码和前64k个字符实体(译注:如果你不明白这句译文,可能你需要了解一下Unicode编码)。 它无法做些什么 TinyXML不解析不使用DTDs(文档类型定义)或者XSLs(可扩展样式表语言)。有其它解析器(到www.sourceforge.org搜索一下XML)具有更加全面的特性,但它们也就更大,需要花更长的时间来建立你的项目,有更陡的学习曲线,而且经常有一个更严格的许可协议。如果你是用于浏览器或者有更复杂的XML需要,那么TinyXML不适合你。 下面的DTD语法在TinyXML里是不做解析的: <!DOCTYPE Archiv [ ]> 因为TinyXML把它看成是一个带着非法嵌入!ELEMENT结点的!DOCTYPE结点。或许这在将来会得到支持。 指南 有耐性些,这是一份能很好地指导你怎么开始的指南,它(非常短小精悍)值得你花时间完整地读上一遍。 TinyXML指南 代码状况 TinyXML是成熟且经过测试的代码,非常健壮。如果你发现了漏洞,请提交漏洞报告到sourcefore网站上 (www.sourceforge.net/projects/tinyxml)。 我们会尽快修正。 有些地方可以让你得到提高,如果你对TinyXML的工作感兴趣的话可以上sourceforge查找一下。 相关项目 你也许会觉得TinyXML很有用!(简介由项目提供) TinyXPath (http://tinyxpath.sourceforge.net). TinyXPath是一个小巧的XPath语法译码器脚本,用C++写成。 TinyXML++ (http://code.google.com/p/ticpp/). TinyXML++是一个全新的TinyXML接口,使用了许多诸如模板,异常处理和更好的错误处理这些C++强项技术。 特性 使用STL TinyXML可以被编译成使用或不使用STL。如果使用STL,TinyXML会使用std::string类,而且完全支持std::istream,std::ostream,operator<>。许多API方法都有 ‘const char*’和’const std::string&’两个版本。 如果被编译成不使用STL,则任何STL都不会被包含。所有string类都由TinyXML它自己实现。所有API方法都只提供’const char*’传入参数。 使用运行时定义: TIXML_USE_STL 来编译成不同的版本。这可以作为参数传给编译器或者在“tinyxml.h”文件的第一行进行设置。 注意:如果在Linux上编译测试代码,设置环境变量TINYXML_USE_STL=YES/NO可以控制STL的编译。而在Windows上,项目文件提供了STL和非STL两种目标文件。在你的项目中,在tinyxml.h的第一行添加"#define TIXML_USE_STL"应该是最简单的。 UTF-8 TinyXML支持UTF-8,所以可以处理任何语言的XML文件,而且TinyXML也支持“legacy模式”——一种在支持UTF-8之前使用的编码方式,可能最好的解释是“扩展的ascii”。 正常情况下,TinyXML会检测出正确的编码并使用它,然而,通过设置头文件中的TIXML_DEFAULT_ENCODING值,TinyXML可以被强制成总是使用某一种编码。 除非以下情况发生,否则TinyXML会默认使用Legacy模式: 如果文件或者数据流以非标准但普遍的"UTF-8引导字节" (0xef 0xbb 0xbf)开始,TinyXML会以UTF-8的方式来读取它。 如果包含有encoding="UTF-8"的声明被读取,那么TinyXML会以UTF-8的方式来读取它。 如果读取到没有指定编码方式的声明,那么TinyXML会以UTF-8的方式来读取它。 如果包含有encoding=“其它编码”的声明被读取,那么TinyXML会以Legacy模式来读取它。在Legacy模式下,TinyXML会像以前那样工作,虽然已经不是很清楚这种模式是如何工作的了,但旧的内容还得保持能够运行。 除了上面提到的情况,TinyXML会默认运行在Legacy模式下。 如果编码设置错误或者检测到错误会发生什么事呢?TinyXML会尝试跳过这些看似不正确的编码,你可能会得到一些奇怪的结果或者乱码,你可以强制TinyXML使用正确的编码模式。 通过使用LoadFile( TIXML_ENCODING_LEGACY )或者LoadFile( filename, TIXML_ENCODING_LEGACY ), 你可以强制TinyXML使用Legacy模式。你也可以通过设置TIXML_DEFAULT_ENCODING = TIXML_ENCODING_LEGACY来强制一直使用Legacy模式。同样的,你也可以通过相同的方法来强制设置成TIXML_ENCODING_UTF8。 对于使用英文XML的英语用户来说,UTF-8跟low-ASCII是一样的。你不需要知道UTF-8或者一点也不需要修改你的代码。你可以把UTF-8当作是ASCII的超集。 UTF-8并不是一种双字节格式,但它是一种标准的Unicode编码!TinyXML当前不使用或者直接支持wchar,TCHAR,或者微软的_UNICODE。"Unicode"这个术语被普遍地认为指的是UTF-16(一种unicode的宽字节编码)是不适当的,这是混淆的来源。 对于“high-ascii”语言来说——几乎所有非英语语言,只要XML被编码成UTF-8, TinyXML就能够处理。说起来可能有点微妙,比较旧的程序和操作系统趋向于使用“默认”或者“传统”的编码方式。许多应用程序(和几乎所有现在的应用程序)都能够输出UTF-8,但是那些比较旧或者难处理的(或者干脆不能使用的)系统还是只能以默认编码来输出文本。 比如说,日本的系统传统上使用SHIFT-JIS编码,这种情况下TinyXML就无法读取了。但是一个好的文本编辑器可以导入SHIFT-JIS的文本然后保存成UTF-8编码格式的。 Skew.org link上关于转换编码的话题做得很好。 测试文件“utf8test.xml”包含了英文、西班牙文、俄文和简体中文(希望它们都能够被正确地转化)。“utf8test.gif”文件是从IE上截取的XML文件快照。请注意如果你的系统上没有正确的字体(简体中文或者俄文),那么即使你正确地解析了也看不到与GIF文件上一样的输出。同时要注意在一个西方编码的控制台上(至少我的Windows机器是这样),Print()或者printf()也无法正确地显示这个文件,这不关TinyXML的事——这只是操作系统的问题。TinyXML没有丢掉或者损坏数据,只是控制台无法显示UTF-8而已。 实体 TinyXML认得预定义的特殊“字符实体”,即: & & < > " " &apos; ‘ 这些在XML文档读取时都会被辨认出来,并会被转化成等价的UTF-8字符。比如下面的XML文本: Far & Away 从TiXmlText 对象查询出来时会变成"Far & Away"这样的值,而写回XML流/文件时会以“&”的方式写回。老版本的TinyXML“保留”了字符实体,而在新版本中它们会被转化成字符串。 另外,所有字符都可以用它的Unicode编码数字来指定, " "和" "都表示不可分的空格字符。 打印 TinyXML有几种不同的方式来打印输出,当然它们各有各的优缺点。 Print( FILE* ):输出到一个标准C流中,包括所有的C文件和标准输出。 "相当漂亮的打印", 但你没法控制打印选项。 输出数据直接写到FILE对象中,所以TinyXML代码没有内存负担。 被Print()和SaveFile()调用。 operator<<:输出到一个c++流中。 与C++ iostreams集成在一起。 在"network printing"模式下输出没有换行符,这对于网络传输和C++对象之间的XML交换有好处,但人很难阅读。 TiXmlPrinter:输出到一个std::string或者内存缓冲区中。 API还不是很简练。 将来会增加打印选项。 在将来的版本中可能有些细微的变化,因为它会被改进和扩展。 流 设置了TIXML_USE_STL,TinyXML就能支持C++流(operator <>)和C(FILE*)流。但它们之间有些差异你需要知道: C风格输出: 基于FILE* 用Print()和SaveFile()方法 生成具有很多空格的格式化过的输出,这是为了尽可能让人看得明白。它们非常快,而且能够容忍XML文档中的格式错误。例如一个XML文档包含两个根元素和两个声明仍然能被打印出来。 C风格输入: 基于FILE* 用Parse()和LoadFile()方法 速度快,容错性好。当你不需要C++流时就可以使用它。 C++风格输出: 基于std::ostream operator<> 从流中读取XML使其可用于网络传输。通过些小技巧,它知道当XML文档读取完毕时,流后面的就一定是其它数据了。TinyXML总假定当它读取到根结点后XML数据就结束了。换句话说,那些具有不止一个根元素的文档是无法被正确读取的。另外还要注意由于STL的实现和TinyXML的限制,operator>>会比Parse慢一些。 空格 对是保留还是压缩空格这一问题人们还没达成共识。举个例子,假设‘_’代表一个空格,对于"Hello____world",HTML和某些XML解析器会解释成"Hello_world",它们压缩掉了一些空格。而有些XML解析器却不会这样,它们会保留空格,于是就是“Hello____world”(记住_表示一个空格)。其它的还建议__Hello___world__应该变成Hello___world 。 这是一个解决不能让我满意的问题。TinyXML一开始就两种方式都支持。调用TiXmlBase::SetCondenseWhiteSpace( bool )来设置你想要的结果,默认是压缩掉多余的空格。 如果想要改变默认行为,你应该在解析任何XML数据之前调用TiXmlBase::SetCondenseWhiteSpace( bool ) ,而且我不建议设置之后再去改动它。 句柄 想要健壮地读取一个XML文档,检查方法调用后的返回值是否为null是很重要的。一种安全的检错实现可能会产生像这样的代码: TiXmlElement* root = document.FirstChildElement( "Document" ); if ( root ) { TiXmlElement* element = root->FirstChildElement( "Element" ); if ( element ) { TiXmlElement* child = element->FirstChildElement( "Child" ); if ( child ) { TiXmlElement* child2 = child->NextSiblingElement( "Child" ); if ( child2 ) { // Finally do something useful. 用句柄的话就不会这么冗长了,使用TiXmlHandle类,前面的代码就会变成这样: TiXmlHandle docHandle( &document ); TiXmlElement* child2 = docHandle.FirstChild( "Document" ).FirstChild( "Element" ).Child( "Child", 1 ).ToElement(); if ( child2 ) { // do something useful 这处理起来容易多了。 查阅TiXmlHandle可以得到更多的信息。 行列追踪 对于某些应用程序来说,能够追踪节点和属性在它们源文件中的原始位置是很重要的。另外,知道解析错误在源文件中的发生位置可以节省大量时间。 TinyXML能够追踪所有结点和属性在文本文件中的行列原始位置。TiXmlBase::Row() 和 TiXmlBase::Column() 方法返回结点在源文件中的原始位置。正确的制表符号可以经由TiXmlDocument::SetTabSize() 来配置。 使用与安装 编译与运行xmltest: 提供了一个Linux Makefile和一个Windows Visual C++ .dsw 文件。只需要简单地编译和运行,它就会在你的磁盘上生成demotest.xml文件并在屏幕上输出。它还尝试用不同的方法遍历DOM并打印出结点数。 那个Linux makefile很通用,可以运行在很多系统上——它目前已经在mingw和MacOSX上测试过。你不需要运行 ‘make depend’,因为那些依赖关系已经硬编码在文件里了。 用于VC6的Windows项目文件 tinyxml: tinyxml 库,非STL tinyxmlSTL: tinyxml 库,STL tinyXmlTest: 用于测试的应用程序,非STL tinyXmlTestSTL: 用于测试的应用程序,STL Makefile 在makefile的顶部你可以设置: PROFILE,DEBUG,和TINYXML_USE_STL。makefile里有具体描述。 在tinyxml目录输入“make clean”然后“make”,就可以生成可执行的“xmltest”文件。 在某一应用程序中使用: 把tinyxml.cpp,tinyxml.h, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.cpp, 和 tinystr.h 添加到你的项目和makefile中。就这么简单,它可以在任何合理的C++适用系统上编译。不需要为TinyXML打开异常或者运行时类型信息支持。 TinyXML怎么工作 举个例子可能是最好的办法,理解一下: Go to the Toy store! Do bills 它称不上是一个To Do列表,但它已经足够了。像下面这样读取并解析这个文件(叫“demo.xml”)你就能创建一个文档: TiXmlDocument doc( "demo.xml" ); doc.LoadFile(); 现在它准备好了,让我们看看其中的某些行和它们怎么与DOM联系起来。 第一行是一个声明,它会转化成TiXmlDeclaration 类,同时也是文档结点的第一个子结点。 这是TinyXML唯一能够解析的指令/特殊标签。一般来说指令标签会保存在TiXmlUnknown 以保证在它保存回磁盘时不会丢失这些命令。 这是一个注释,会成为一个TiXmlComment对象。 "ToDo"标签定义了一个TiXmlElement 对象。它没有任何属性,但包含另外的两个元素。 生成另一个TiXmlElement对象,它是“ToDo”元素的子结点。此元素有一个名为“priority”和值为“1”的属性。 Go to the TiXmlText ,这是一个叶子结点,它不能再包含其它结点,是"Item" TiXmlElement的子结点。 另一个TiXmlElement, 这也是“Item”元素的子结点。 等等 最后,看看整个对象树: TiXmlDocument "demo.xml" TiXmlDeclaration "version=’1.0′" "standalone=no" TiXmlComment " Our to do list data" TiXmlElement "ToDo" TiXmlElement "Item" Attribtutes: priority = 1 TiXmlText "Go to the " TiXmlElement "bold" TiXmlText "Toy store!" TiXmlElement "Item" Attributes: priority=2 TiXmlText "Do bills" 文档 本文档由Doxygen使用‘dox’配置文件生成。 许可证 TinyXML基于zlib许可证来发布: 本软件按“现状”提供(即现在你看到的样子),不做任何明确或隐晦的保证。由使用此软件所引起的任何损失都决不可能由作者承担。 只要遵循下面的限制,就允许任何人把这软件用于任何目的,包括商业软件,也允许修改它并自由地重新发布: 1. 决不能虚报软件的来源;你决不能声称是你是软件的第一作者。如果你在某个产品中使用了这个软件,那么在产品文档中加入一个致谢辞我们会很感激,但这并非必要。 2. 修改了源版本就应该清楚地标记出来,决不能虚报说这是原始软件。 3. 本通告不能从源发布版本中移除或做修改。 参考书目 万维网联盟是定制XML的权威标准机构,它的网页上有大量的信息。 权威指南:http://www.w3.org/TR/2004/REC-xml-20040204/ 我还要推荐由OReilly出版由Robert Eckstein撰写的"XML Pocket Reference"……这本书囊括了入门所需要的一切。 捐助者,联系人,还有简史 非常感谢给我们建议,漏洞报告,意见和鼓励的所有人。它们很有用,并且使得这个项目变得有趣。特别感谢那些捐助者,是他们让这个网站页面生机勃勃。 有很多人发来漏洞报告和意见,与其在这里一一列出来不如我们试着把它们写到“changes.txt”文件中加以赞扬。 TinyXML的原作者是Lee Thomason(文档中还经常出现“我”这个词) 。在Yves Berquin,Andrew Ellerton,和tinyXml社区的帮助下,Lee查阅修改和发布新版本。
Linux 操作系统基础教程 清华大学信息学院计算机系 目 录 前言..................................................................................................................................................2 第一讲 Linux基础...........................................................................................................................2 一.什么是Linux?.................................................................................................................2 二.安装Linux的好处?.........................................................................................................3 三.如何得到Linux?.............................................................................................................3 四.如何得到Linux的最新消息?.........................................................................................3 五.Linux操作系统上有什么应用?.....................................................................................4 六.在那里可以找到讨论区?..............................................................................................5 七.安装过程..........................................................................................................................5 第二讲 Linux基础进阶...................................................................................................................5 一.Linux的文件系统结构.....................................................................................................6 二. 文件类型...........................................................................................................................7 三.Linux基本操作命令............................................................................................................8 四.基本的系统管理命令.......................................................................................................14 五.关於 Process 处理的指令...............................................................................................16 六. 关於字串处理的指令.....................................................................................................17 七. 网路上查询状况的指令.................................................................................................17 八. 网路指令.........................................................................................................................18 九. 关於通讯用的指令.........................................................................................................21 十. 编译器( Compiler )..........................................................................................................22 十一. 有关列印的指令.........................................................................................................22 第三讲 Linux下的网络服务,配置问题和常用工具.................................................................24 一.Linux下的网络服务.......................................................................................................24 二.几种重要的配置文件.......................................................................................................26 三.Linux下常用的工具软件..................................................................................................28 尾语................................................................................................................................................31 前言 Linux 是在 1991 年发展起来的与 UNIX兼容的操作系统,可以免费使用,它的源代码 可以自由传播且可任人修改、充实、发展,开发者的初衷是要共同创造一个完美、理想并 可以免费使用的操作系统。 我们并不能使同学们通过这次系列讲座成为一个 UNIX 类操作系统的高手,这次系列 讲座的目的就是在同学们中间普及 Linux 基础知识,为今后我们更加接近的了解 Linux 做一 个好的开端。 第一讲 Linux基础 在这一讲中,我们主要是了解一下 Linux 的概况,以及对 Linux 有一个初步的感性认识。 一.什么是LinuxLinux 是一个以 Intel 系列 CPU(CYRIX,AMD 的 CPU也可以)为硬件平台,完全免费的 UNIX 兼容系统,完全适用于个人的 PC。它本身就是一个完整的 32 位的多用户多任务操作 系统,因此不需要先安装 DOS 或其他的操作系统(MS Windows, OS2, MINIX..)就可以进 行直接的安装。 Linux的最早起源是在1991年10月5日由一位芬兰的大学生Linux Torvalds ([email protected])写了 Linux核心程序的 0.02 版开始的,但其后的发展却几乎都 是由互联网上的 Linux社团(Linux Community)互通交流而完成的。Linux 不属于任何一 家公司或个人,任何人都可以免费取得甚至修改它的源代码(source code)。Linux 上的大部 分软件都是由 GNU倡导发展起来的,所以软件通常都会在附着 GNU Public License(GPL) 的情况下被自由传播。GPL 是一种可以使你免费获得自由软件的许可证,因此 Linux 使用 者的使用活动基本不受限制(只要你不将它用于商业目的),而不必像使用微软产品是那样, 2需要为购满许可证付出高价还要受到系统安装数量的限制。我在讲义的最后面附有 GPL 的 非官方中文译稿。目前 Linux 中国的发行版本(Linux Distribution)主要有 Red Hat (红帽子) , Slackware, Caldera, Debian, Red Flag (红旗) , Blue Point (蓝点) , Xteam Linux (冲浪) , Happy Linux(幸福Linux), Xlinux 等若干种,我推荐同学们使用的发行版本是 Red Hat(事实标 准)和 Xlinux(安装最容易)。 二.安装Linux的好处? Linux的核心具有 Windows 无法比拟的稳定性和高效率,在不使用 X Windows 的情况 下,它占用系统资源较少,可以使一台 Intel486摇身一变成为高效工作站。对于想要学习 UNIX的用户来说,使他们熟悉 UNIX 操作环境,通往"骨灰级"高手境界的一大捷径。最重 要的是,Linux 上有公认的 C 语言世界最好的编译器 gcc,如果你想得到一个效率更高的开 发环境(并不一定是最友好的,但一定是最强大的),我建议你一定要好好的熟悉一下 Linux。 三.如何得到Linux? 据我所知,大多数的 Linux 发行版本(Linux distribution)和核心(Kernel)都是可以 从网上下载的,但是我不推荐易用这种方法得到 Linux,因为仅仅核心就有几十个 Mbit 的 数据量,而一个完整的发行版本大概都是 1Gbit 左右的数据量,你自己可以估计一下得用多 少时间来下载它们?我建议你最好去软件商店买光盘来,因为 Linux 的产品光盘是非常便宜 的,连带许可证 GPL 在内你大概支付 50 元人民币就可以,而具有同样功能的 Windows NT 4.0 你至少得付出 17000元人民币(有一点需要声明:在你购买光盘时 GPL 许可证你是不会 肉眼看到的)。直接到商店去买,可以省去你很多麻烦,因为从网上下载的 Linux有很多它 还是要求你有光盘刻录工具将安装文件刻到光盘上。 四.如何得到Linux的最新消息? 关于 Linux 的站点现在到处都是,我这里向大家推荐的是一个关于 Linux 核心最新消息 的一个网站,你可以得到核心(Kernel)发展情况的最新信息。网址如下: http://www.kernel.org 另外还有一个非常著名的讨论组,你也可以去看看:http://www.linuxforum.net 另外还有一 个我常去的讨论组,这个讨论组是有高手专门维护的,而且回应贴子的速度很快: http://www.coventive.com.cn/club/default.htm在我这份讲义快写完的时候,又有一个非常好的 自由软件团体出现了,那就是 AKA,大家可以到他们的网页上去看看,里面有许多很实用的 3信息:http://www.aka.org.cn 五.Linux操作系统上有什么应用? Linux 上有丰富的的应用软件,在这里我给大家做一个简单的介绍,具体它们是什么样 子我会在讲座上为大家一一演示。 文本处理方面(控制台界面,X Window界面在后面介绍) vi 最令 UNIX类操作系统初学者裹足不前的 editor,然而只要你习惯于操作,你会觉得 它比任何的 editor都好用,且功能强大。 pico 一种风格很像 Microsoft DOS的 EDIT 的一种文本编辑器。 中文化方面 XCIN+Crxvt 缺省的 Linux 系统是不支持显示中文的,虽然现在国内涌现出许多著名的 Linux 汉化厂商,但是一些著名的 Linux distribution 如 Red Hat、Debian、Caldera 仍然不支 持中文的输入和输出。这套汉化工具组合在控制台(console)方式和 X Window方式下都可 以显示和输入汉字信息。 Cxterm 可以很容易的自行设置输入法,或者修改现有的输入法表格。 视窗界面(window manager)方面 KDE 这是 X Window System使用率最高的 Window Manager。 lFvwm 公认的最为好用的 Window Manager之一。 Fvwm95 拥有和 Microsoft Win95 同样界面的 Window Manager。 Afterstep 公认的最好看的 Window Manager,但号内存也很大。 Enlightenment 界面最华丽的 Window Manager, Win95 和它相比简直就是 nothing,但是 号内存太大,有点华而不实。 lIcewin 又一个极富个性的 Window Manager。 视窗应用软件方面 WWW Browser Netscape公司的 navigator3.x 和communicator4.x 版可用,使用方法和 MS Windows上一样。 图像处理 GIMP是类似于 Photoshop的绘图软件,号称是 Linux 上最强的绘图软件。 看图工具 MTV 这是一个可以播放 VCD的软件,但是它是共享软件(Shareware),不是免费软件, 我们也得不到它的源代码。 Star Office 这是一套著名的办公软件,我个人认为它无论在界面上还是在功能上都强于 Microsoft Office 产品。唯一的缺憾是他不支持汉字,无论 GB 还是 BIG5。 Word Perfect 这是一个非常精彩的字处理软件,功能类似于 Microsoft Word。 4文杰字处理系统 这是一套由韩国人开发的字处理系统,功能强大,有专门的中文版推出, 类似于 Microsoft Word。 编译环境 gcc 公认的C 语言世界中功能最为强大的编译器,但是界面不是很友好。 除此之外还有 FORTRAN、 Pascal、 GNU make、 GNU debugger、 GNU LISP、 GNU PERL、 TCL。 这里因为本人对这些编译工具都不熟悉,因此不多介绍。 MS Windows的模拟环境 WINE 可以使绝大多数的 16 位 MS Window程序运行在这个模拟环境中。但是不支持 32 位的程序。 六.在那里可以找到讨论区? 大家最熟悉的是北邮的 BBS: 202.204.7.235 port:23 七.安装过程 这是非常重要的一部分,希望大家仔细了解本部分内容。 就我个人认为,对于初学者来说,Linux 的安装过程是相当难的,新手往往会遇到系统 屡装不成的情况。遇到这种事情,是非常痛苦的,但是几乎每个新手又都会遇到,因此我 觉得安装过程应当仔细的说明一下。但是由于篇幅有限,我不见这个这个问题在讲义的正 文中陈述,而是把它放在附文 2 中仔细说明。希望没有安装过 Linux 的同学们将这篇文章看 一看。我想在上课的时候我会给大家演示一遍安装的过程。 第二讲 Linux基础进阶 经过上一节课的探讨,我想同学们应该对 Linux 有了一个初步的感性认识,但我们的 认识还只是处在一个尚需进步的表层上。通过这一节的学习,同学们会对 Linux 的体系结构, 它的基本操作,基本功能有一个更进一步的认识。 5 一.Linux的文件系统结构 Linux的文件系统和MS-Windows的文件系统有很大的不同,对于微软视窗系统的文件 结构我在这里不再多说,我们主要了结一下 linux的文件系统结构. linux 只有一个文件树,整 个文件系统是以一个树根"/"为起点的,所有的文件和外部设备都以文件的形式挂结在这个文 件树上,包括硬盘,软盘,光驱,调制解调器等,这和以"驱动器盘符为基础的 MS-Windows 系统 是大不相同的.Linux 的文件结构体现了这个操作系统简洁清析的设,常我们能够接触到的 linux 发行版本的根目录大都是以下结构: /bin /etc /lost+found /sbin /var /boot /root /home /mnt /tmp /dev /lib /proc /usr 现在我将这些目录给大家做一个简要的介绍: 1. /bin和/sbin 使用和维护UNIX和Linux系统的大部分基本程序都包含在/bin和/sbin里,这两个目录 的名气之所以包含 bin,是因为可执行的程序都是二进制文件(binary files). /bin 目录通常用来存放用户最常用的基本程序,如: login Shells 文件操作实用程序 系统实用程序 压缩工具 /sbin 目录通常存放基本的系统系统维护程序,如: fsck fdisk mkfs shutdown lilo init 存放在这两个目录中的程序的主要区别是:/sbin 中的程序只能由 root(管理员)来执行. 2. /etc 这个目录一般用来存放程序所需的整个文件系统的配置文件,其中的一些重要文件如 下: passwd shadow fstab hosts motd profile shells services lilo.conf 3. /lost+found 这个目录专门是用来放那些在系统非正常菪机后重新启动系统时,不知道改网哪里恢复 的"流浪"文件的。 4. /boot 这个目录下面存放着和系统启动有关系的各种文件,包括系统的引导程序和系统核心 部分。 65. /root 这是系统管理员(root)的主目录。 6. /home 系统中所有用户的主目录都存放在/home 中,它包含实际用户(人)的主目录和其他用户 的主目录.Linux同 UNIX 的不同之处是,Linux的 root 用户的主目录通常是在/root或 /home/root,而 UNIX 通常是在/。 7. /mnt 按照约定,像 CD-ROM,软盘,Zip盘,或者 Jaz这样的可以动介质都应该安装在/mnt 目录下,/mnt 目录通常包含一些子目录,每个子目录是某种特定设备类型的一个安装点。 例如: /cdrom /floppy /zip /win .... 如果我们要使用这些特定设备,我们需要用 mount 命令从/dev 目录中将外部设备挂接 过来。在这里大家可能看到了有一个 win 的目录,这是我的机子上面做的一个通向 windows 文件系统的挂接点,这样我通过访问这个目录就可以访问到我在 windows 下面的文件了。 但如果你的 windows 文件系统是 NTFS 格式,那么这个办法就不行了。 8. /tmp和/var 这两个目录用来存放临时文件和经常变动的文件。 9. /dev 这是一个非常重要的目录,它存放着各种外部设备的镜像文件,其中有一些内容我们 是要牢牢记住的。例如第一个软盘驱动器的名字是 fd0;第一个硬盘的名字是 hda,硬盘中的 第一个分区是 hda1,第二个分区是 hda2;第一个光盘驱动器的名字是 hdc;此外,还用 modem 和其他外设的名字,在这么多的名字中,我们只需要记住最最常用的那几个外设就可以了。 10. /usr 按照约定,这个目录用来存放与系统的用户直接相关的程序或文件,这里面有每一个 系统用户的主目录,就是相对于他们的小型"/"。 11. /proc 这个目录下面的内容是当前在系统中运行的进程的虚拟镜像,我们在这里可以看到由 当前运行的进程号组成的一些目录,还有一个记录当前内存内容的 kernel 文件。 就个人经验,我认为这些目录以及在它们下面应该存储什么内容,我们都应当很熟练的 记下来,这对于我们进一步的使用系统是很有帮助的。 二. 文件类型 本来我是想把基本操作命令放在这里介绍一下,但是这些命令中又不少是涉及到文件类 7型的,所以我就只好先介绍一下文件类型了。 Linux 的文件类型大致可分为五类,而且它支持长文件名,不论是文件还是目录名,最 长可以达到 256 个字节。如果你能够用 128 个汉字写一片小作文,那你也可以用它来做某 个文件的文件名(当然这里面不能有不合规定的命名字符存在)。 1. 一般性文件 一般性文件,例如纯文本文件 mtv-0.0b4.README,设置文件 lilo.conf,记录文件 ftp.log 等等都是。一般类型的文件在控制台的显示下都没有颜色,系统默认的是白色。 2. 目录 至于目录是什么意思我就不解释了,我的任务是要告诉大家,你可以用 cd+目录名进 入到这个目录中去,而这个目录在控制台下显示的颜色是蓝色的,非常容易辨认。如果你 用 ls -l 来观看它们,会发现它们的文件属性(共 10 个字符)的一个字符是 d,这表明它是一 个目录,而不是其它的东西。 三.Linux基本操作命令 首先介绍一个名词"控制台(console)",它就是我们通常见到的使用字符操作界面的 人机接口,例如 dos。我们说控制台命令,就是指通过字符界面输入的可以操作系统的命令, 例如dos命令就是控制台命令。我们现在要了解的是基于Linux操作系统的基本控制台命令。 有一点一定要注意,和 dos 命令不同的是,Linux 的命令(也包括文件名等等)对大小 写是敏感的,也就是说,如果你输入的命令大小写不对的话,系统是不会做出你期望的响 应的。 1. ls 这个命令就相当于 dos 下的 dir命令一样,肯定是我第一个就要介绍的,这也是 Linux 控制台命令中最为重要几个命令之一。ls 最常用的参数有三个: -a -l -F。 ls -a Linux 上的文件以.开头的文件被系统视为隐藏文件,仅用 ls 命令是看不到他们的,而用 ls -a 除了显示 一般文件名外,连隐藏文件也会显示出来。 ls -l(这个参数是字母 L 的小写,不是数字 1) 这个命令可以使用长格式显示文件内容,如果需要察看更详细的文件资料,就要用到 ls -l 这个指令。例如我在某个目录下键入 ls -l 可能会显示如下信息(最上面两行是我自己加 的): 位置 1 2 3 4 5 6 7 文件属性 文件数 拥有者 所属的group 文件大小 建档日期 文件名 drwx------ 2 Guest users 1024 Nov 21 21:05 Mail 8 -rwx--x--x 1 root root 89080 Nov 7 22:41 tar* -rwxr-xr-x 1 root bin 5013 Aug 15 9:32 uname* lrwxrwxrwx 1 root root 4 Nov 24 19:30 zcat->gzip -rwxr-xr-x 1 root bin 308364 Nov 29 7:43 zsh* -rwsr-x--- 1 root bin 9853 Aug 15 5:46 su* 下面,我为大家解释一下这些显示内容的意义。 第一个栏位,表示文件的属性。 Linux 的文件基本上分为三个属性:可读(r),可写(w),可执行(x)。但是这里有 十个格子可以添(具体程序实现时,实际上是十个 bit 位)。第一个小格是特殊表示格,表 示目录或连结文件等等,d 表示目录,例如 drwx------;l 表示连结文件,如 lrwxrwxrwx;如果 是以一横"-"表示,则表示这是文件。其余剩下的格子就以每 3 格为一个单位。因为 Linux 是多用户多任务系统,所以一个文件可能同时被许多人使用,所以我们一定要设好每个文 件的权限,其文件的权限位置排列顺序是(以-rwxr-xr-x 为例): rwx(Owner)r-x(Group)r-x(Other) 这个例子表示的权限是:使用者自己可读,可写,可执行;同一组的用户可读,不可 写,可执行;其它用户可读,不可写,可执行。另外,有一些程序属性的执行部分不是 X, 而是 S,这表示执行这个程序的使用者,临时可以有和拥有者一样权力的身份来执行该程序。 一般出现在系统管理之类的指令或程序,让使用者执行时,拥有 root身份。 第二个栏位,表示文件个数。 如果是文件的话,那这个数目自然是 1 了,如果是目录的话,那它的数目就是该目录 中的文件个数了。 第三个栏位,表示该文件或目录的拥有者。 若使用者目前处于自己的 Home,那这一栏大概都是它的账号名称。 第四个栏位,表示所属的组(group)。 每一个使用者都可以拥有一个以上的组,不过大部分的使用者应该都只属于一个组,只 有当系统管理员希望给予某使用者特殊权限时,才可能会给他另一个组。 第五栏位,表示文件大小。 文件大小用 byte 来表示,而空目录一般都是 1024byte,你当然可以用其它参数使文件 显示的单位不同,如使用 ls -k 就是用 kb 莱显示一个文件的大小单位,不过一般我们还是以 byte 为主。 第六个栏位,表示创建日期。 以"月,日,时间"的格式表示,如 Aug 15 5:46表示 8 月15日早上 5:46分。 第七个栏位,表示文件名。 我们可以用 ls -a 显示隐藏的文件名。 Ls -F(注意,是大写的 F) 9 使用这个参数表示在文件的后面多添加表示文件类型的符号,例如*表示可执行,/表示 目录,@表示连结文件,这都是因为使用了-F这个参数。但是现在基本上所有的 Linux 发 行版本的 ls都已经内建了-F参数,也就是说,不用输入这个参数,我们也能看到各种分辨 符号。 2. cd命令 这个命令是用来进出目录的,它的使用方法和在 dos 下没什么两样,所以我觉得没什么 可说的,但有两点我补充一下。 首先,和dos 不同的是Linux 的目录对大小写是敏感的,如果大小写没拼对,你的 cd 操作是成功不了的。 其次,cd如果直接输入,cd 后面不加任何东西,会回到使用者自己的 Home Directory。 假设如果是 root,那就是回到/root.这个功能同 cd ~是一样的。 3. mkdir,rmdir 命令 mkdir 命令用来建立新的目录,rmdir用来删除以建立的目录,这两个指令的功能不再 多加介绍,他们同 dos下的 md,rd 功能和用法都是基本一样的。 4. cp命令 这个命令相当于 dos下面的 copy命令,具体用法是: cp -r 源文件(source) 目的文件(target) 参数 r是指连同元文件中的子目录一同拷贝。熟悉 dos 的读者用起这个命令来会觉得更 方便,毕竟比在 dos 下面要少敲两下键盘。 5. rm 命令 这个命令是用来删除文件的,和 dos 下面的 rm(删除一个空目录)是有区别的,大家 千万要注意。Rm命令常用的参数有三个: -i,-r,-f。 比如我现在要删除一个名字为 text 的一个文件: rm -i test 系统会询问我们:"rm:remove 'test'?y",敲了回车以后,这个文件才会真的被删除。之 所以要这样做,是因为 linux 不象dos那样有 undelete 的命令,或者是可以用 pctool 等工具 将删除过的文件救回来,linux 中删除过的文件是救不回来的,所以使用这个参数在删除前 让你再确定一遍,是很有必要的。 rm -r 目录名 这个操作可以连同这个目录下面的子目录都删除,功能上和 rmdir相似。 rm -f 文件名(目录名) 这个操作可以进行强制删除。 6. mv 命令 这个命令的功能是移动目录或文件,引申的功能是给目录或文件重命名。它的用法同 10dos 下面的 move 基本相同,这里不再多讲。当使用该命令来移动目录时,他会连同该目录 下面的子目录也一同移走。另外因为 linux 下面没有 rename 的命令,所以如果你想给一个 文件或目录重命名时可以用以下方法: mv 原文件(目录)名 新的文件(目录)名 7. du,df 命令 du 命令可以显示目前的目录所占的磁盘空间,df 命令可以显示目前磁盘剩余的磁盘空 间。 如果 du 命令不加任何参数,那么返回的是整个磁盘的使用情况,如果后面加了目录的 话,就是这个目录在磁盘上的使用情况(这个功能可是 dos 没有的呦)。不过我一般不喜欢 用 du,因为它给出的信息是在是太多了,我看不过来,而 df这个命令我是最常用的,因为 磁盘上还剩多少空间对我来说是很重要的。 8. cat 命令 这个命令是 linux 中非常重要的一个命令,它的功能是显示或连结一般的 ascii 文本文 件。cat是 concatenate 的简写,类似于 dos 下面的 type 命令。它的用法如下: cat text 显示 text 这个文件 cat file1 file2 依顺序显示 file1,file2的内容 cat file1 file2>file3 把 file1,file2 的内容结合起来,再"重定向(>)"到 file3文件中。 "〉"是一个非常有趣的符号,是往右重定向的意思,就是把左边的结果当成是输入,然 后输入到 file3 这个文件中。这里要注意一点是 file3 是在重定向以前还未存在的文件,如果 file3 是已经存在的文件,那么它本身的内容被覆盖,而变成 file1+file2的内容。 如果〉左边没有文件的名称,而右边有文件名,例如: cat >file1 结果是会"空出一行空白行",等待你输入文字,输入完毕后再按[Ctrl]+[c]或[Ctrl]+[d], 就会结束编辑,并产生 file1 这个文件,而 file1 的内容就是你刚刚输入的内容。这个过程和 dos 里面的copy con file1的结果是一样的。 另外,如果你使用如下的指令: cat file1>>file2 这将变成将 file1 的文件内容"附加"到 file2 的文件后面,而 file2 的内容依然存在,这种 重定向符〉〉比〉常用,可以多多利用。 9. more,less命令 这是两个显示一般文本文件的指令。 如果一个文本文件太长了超过一个屏幕的画面,用 cat 来看实在是不理想,就可以试试 more 和 less两个指令。More 指令可以使超过一页的文件临时停留在屏幕,等你按任何的一 个键以后,才继续显示。而 less 除了有 more 的功能以外,还可以用方向键往上或网下的滚 11动文件,所以你随意浏览,阅读文章时,less 是个非常好的选择。 10. clear 命令 这个命令是用来清除屏幕的,它不需要任何参数,和 dos 下面的 clr具有相同的功能, 如果你觉得屏幕太紊乱,就可以使用它清除屏幕上的信息。 11. pwd命令 这个命令的作用是显示用户当前的工作路径,这个命令不用多说,大家一试即知。 12. ln命令 这是 linux中又一个非常重要命令,请大家一定要熟悉。它的功能是为某一个文件在另 外一个位置建立一个同不的链接,这个命令最常用的参数是-s,具体用法是: ln -s 源文件 目标文件 当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都 放一个必须相同的文件,我们只要在某个固定的目录,放上该文件,然后在其它的目录下 用 ln 命令链接(link)它就可以,不必重复的占用磁盘空间。例如: ln -s /bin/less /usr/local/bin/less -s 是代号(symbolic)的意思。 这里有两点要注意:第一,ln 命令会保持每一处链接文件的同步性,也就是说,不论 你改动了哪一处,其它的文件都会发生相同的变化;第二,ln 的链接又软链接和硬链接两 种,软链接就是 ln -s ** **,它只会在你选定的位置上生成一个文件的镜像,不会占用磁盘空 间,硬链接 ln ** **,没有参数-s, 它会在你选定的位置上生成一个和源文件大小相同的文件, 无论是软链接还是硬链接,文件都保持同步变化。 如果你用ls 察看一个目录时,发现有的文件后面有一个@的符号,那就是一个用 ln 命 令生成的文件,用 ls -l命令去察看,就可以看到显示的 link 的路径了。 13. man命令 如果你的英文足够好,那完全可以不靠任何人就精通 linux,只要你会用 man。Man 实 际上就是察看指令用法的 help,学习任何一种 UNIX类的操作系统最重要的就是学会使用 man 这个辅助命令。man 是 manual(手册)的缩写字,它的说明非常的详细,但是因为它都是 英文,看起来非常的头痛。建议大家需要的时候再去看 man,平常吗,记得一些基本用法 就可以了。 14. logout 命令 一看就知道了,这是退出系统的命令,我就不多说了。要强调的一点是,linux是多用 户多进程的操作系统,因此如果你不用了,退出系统就可以了,关闭系统你就不用操心了, 那是系统管理员的事情。但有一点切记,即便你是单机使用 linux,logout 以后也不能直接 关机,因为这不是关机的命令。 15. Mount 命令 12这是 Linux 初学者问得最多的问题。由于大家已习惯了微软的访问方法,总想用类似 的思路来找到软盘和光盘。但在 Linux 下,却沿袭了 UNIX 将设备当作文件来处理的方法。 所以要访问软盘和光盘,就必须先将它们装载到 Linux 系统的/mnt 目录中来。 装载的命令是 mount,格式如下:mount -t 文件系统类型 设备名 装载目录 文件 系统类型就是分区格式,Linux 支持的文件系统类型有许多: msdos DOS 分区文件系统类型 vfat 支持长文件名的 DOS 分区文件(可以理解为 Windows 文件)系统类型 iso9660 光盘的文件系统类型 ext2 Linux 的文件系统类型 ...... 设备名,指的是你要装载的设备的名称。软盘一般为/dev/fd0 fd1;光盘则根据你的 光驱的位置来决定,通常光驱装在第二硬盘的主盘位置就是/dev/hdc;如果访问的是 DOS 的 分区,则列出其设备名,如/dev/hda1 是指第一硬盘的第一个分区。 装载目录,就是你指 定设备的载入点。 z 装载软盘 首先用 mkdir /mnt/floppy 在/mnt 目录下建立一个空的 floppy目录,然后输入 mount -t msdos /dev/fd0 /mnt/floppy 将 DOS 文件格式的一张软盘装载进来,以后就可以在 /mnt/floppy目录下找到这张软盘的所有内容。 z 装载 Windows 所在的C 盘 mkdir /mnt/c 在/mnt 目录下建立一个空的 c 目录; mount -t vfat /dev/hda1 /mnt/c 将Windows 的C盘按长文件名格式装载到/mnt/c 目 录下,以后在该目录下就能读写 C盘根目录中的内容 z 装载光盘 mkdir /mnt/cdrom 在/mnt 目录下建立一个空的 cdrom 目录; mount -t iso9660 /dev/hdc /mnt/cdrom 将光盘载入到文件系统中来, 将在/mnt/cdrom 目录下找到光盘内容。有的 Linux 版本允许用 mount /dev/cdrom 或 mount /mnt/cdrom 命 令装载光盘。 要注意的是,用 mount命令装入的是软盘、光盘,而不是软驱、光驱。有些初学者容易 犯一个毛病,以为用上面命令后,软驱就成了/mnt/floppy,光驱就成了/mnt/cdrom,其实 不然,当你要换一张光盘或软盘时,一定要先卸载,再对新盘重新装载。 z 卸载 卸载的命令格式是:umonut 目录名,例如要卸载软盘,可输入命令 umonut /mnt/floppy。 要注意的是,在卸载光盘之前,直接按光驱面板上的弹出键是不会起作用的。 13 四.基本的系统管理命令 系统管理基本上可以分为两种,一种是 root(系统管理员)对 linux系统管理部分, root 本身的职责就是负责整个 linux系统的运行稳定,增加系统安全性,校验使用者的身份, 新增使用者或删除恶意的使用者,并明确每一个在机器上的使用者权限等等。另一种就是 每一个使用者(包括 root)对自己文件的权限管理。因为 linux 是多用户多任务系统,每一 个使用者都有可能将其工作的内容或是一些机密性的文件放在 Linux工作站上,所以对每个 文件或是目录的归属和使用权,都要有非常明确的规定。下面我就按管理员和一般用户分 类来介绍基本的系统管理命令。 z 管理员使用的系统管理指令 1. adduser 命令 新增使用者账号的命令,如果你想新增一个叫做 jack 的用户,那么需在控制台下输入: adduser jack 这样就增加了一个名字为 jazk 的用户,要注意这里对大小写是敏感的。另外,新增的 用户是没有口令的,你还应当为用户设置口令或者是吩咐用户在第一次登录系统的时候为 自己设置口令。 2. passwd命令 这个命令可以修改特定用户的口令,使用格式是: passwd 用户名 这是,系统会提示你输入新密码,你输入第一遍后,还要输入第二遍进行确认。输入 两遍相同的密码之后,系统就接受了新的密码。如果这个命令是一般用户来使用的话,那 就只能改变它自己的密码。 3. find,whereis,locate命令 这三个命令都是用来查找文件的,使用格式是: find 路径名称 -name 文件名 参数(我们这里就不讨论参数了) whereis 文件名 locate 文件名 一般来说,find 命令功能最为强大,但是对硬件的损耗也是最大的,当你使用 find 去 查找你个文件时,你会发现硬盘等在不停的闪动,这就意味着你的硬盘可能会比别人的少 用个三四年。当你使用whereis 或locate 去查找文件时,你会发现硬盘却是安安静静的,这 是因为这两个命令是从系统的数据库中查找文件,而不是去拼命的读硬盘。所以,如果平 常你只是想找一些笑文件的话,使用 whereis或 locate 就可以了,如果你是要进行系统管理 的工作,那么使用 find再加上一些参数就可以满足你的要求了。 144. su命令 这个命令可以让普通用户变成具有管理员权限的超级用户(superuser),只要它知道知 道管理员的密码就可以。多用户多任务系统的强调的重点之一就是系统的安全性,所以应 避免直接使用 root 身份登录系统去做一些日常性的操作,因为时间一久 root 密码就有可能 被知道而危害到系统安全。所以平常应避免用 root 身份登录,即使要管理系统,也请尽量 使用 su 指令来临时管理系统,然后记住定期的更换 root 密码。 加入你现在是以一个普通用户的身份登录系统,现在你输入: su 系统会要求你输入管理员的口令,当你输入正确的密码后,就可以获得全部的管理员 权限,这是你就是超级用户(superuser)。但你执行完各种管理操作以后,只要输入 logout 就 可以退回到原先的那个普通用户的状态。 5. shutdown,halt 命令 这两个命令是用来关闭 linux 操作系统的。 在前面我说过,作为一个普通用户是不能够随便关闭系统的,因为虽然你用完了机器, 可是这时候可能还有其它的用户正在使用系统。因此,关闭系统或者是重新启动系统的操 作只有管理员才有权执行。另外 linux 系统在执行的时候会用部分的内存作缓存区,如果内 存上的数据还没有写入硬盘,就把电源拔掉,内存就会丢失数据,如果这些数据是和系统 本身有关的,那么会对系统造成极大的伤害。一般,我们建议在关机之前执行三次同步指 令 sync,可以用分号";"来把指令合并在一起执行,如: # sync;sync;sync 使用 shutdown 关闭系统的时候有以下几种格式: shutdown (系统内置 2分钟关机,并传送一些消息给正在使用的 user) shutdown -h now (下完这个指令,系统立刻关机) shutdown -r now (下完这个指令,系统立刻重新启动,相当于 reboot) shutdown -h 20:25 (系统会在今天的 20:25 关机) shutdown -h +10 (系统会在十分钟后关机) 如果在关机之前,要传送信息给正在机器上的使用者,可以加"-q"的参数,则会输出系 统内置的 shutdown 信息给使用者,通知他们离线。 halt 命令就不用多说了,只要你输入 halt,系统就会开始进入关闭过程,其效果和 shutdown -h now是完全一样的,我每次关机的时候都是用 halt。 6. reboot 命令 一看这个词,就知道这个命令是用来重新启动系统的。 当你输入 reboot 后,你就会看到系统正在将一个一个的服务都关闭掉,然后再关闭文 件系统和硬件,接着机器开始重新自检,重新引导,再次进入 linux 系统。 15z 普通用户使用的系统管理指令 1. chown命令 这个命令的作用是改变文件的所有者。 如果你有一个文件名为 classment.list 的文件,所有权要给于另一个账号为 golden的同 学,则可用 chown 来实现这个操作,但是当你改变了文件的所有者以后,该文件虽然在你 的 Home 目录下,可是你已经无任何修改或删除该文件的权限了,这一点同学们千万要注 意。通常会用到这个指令的时机,应该是你想让 linux 机器上的某位使用者到你的 Home 下 去用谋个文件是会用到。不过,泼出去的水就收不回来了,你用这个命令的时候可一定要 想清楚呦。 2. chmod命令 这个命令用来改变目录或文件的属性,是 linux 中一个应当熟悉的命令。 对这个命令,使用的方法很多,鉴于篇幅的原因,我只例出其中我最常用的一种。前 面讲过,一个文件用 10个小格来记录文件的权限。前三个小格是拥有者(user)本身的权 限,中间三个小格是和使用者同一组的成员(group)的权限,最后三个小格是表示其它使 用者(other)的权限。现在我们用三位的 2 进制数来表示相应的三小格的权限,例如: 111 rwx 101 r-x 011 -wx 001 -x 100 r- 这样一来,我们就可以用三个十进制的数来表示一个文件属性位上的十个格,其中每 一个十进制数大小等于代表每三格的那个三位的二进制数。例如,如果一个文件的属性是: rwxr-r--,那么我们就可以用 744 来代表它的权限属性;如果一个文件的属性是:rwxrwxr--, 那它对应的三个十进制数就是 774。这样一来我们就可以用这种简便的方法指定文件的属性 了。例如,我想把一个文件 test.list的属性设置为 rwxr-x---,那么我只要执行: chmod 750 test.list 就可以了,对于改变后的权限,你用 ls -l 就可以看到。 五.关於 Process 处理的指令 1. ps ps 是用来显示目前你的 process 或系统 processes 的状况。 以下列出比较常用的参数: 其选项说明如下: -a 列出包括其他 users 的 process 状况。 -u 显示 user - oriented 的 process 状况 。 -x 显示包括没有 terminal 控制的 process 状况 。 -w 使用较宽的显示模式来显示 process 状况 。 16我们可以经由 ps 取得目前 processes 的状况,如 pid , running state 等。 2. kill kill 指令的用途是送一个 signal 给某一个 process 。因为大部份送的都是用来杀掉 process 的 SIGKILL 或 SIGHUP ,因此称为 kill 。kill 的用法 为: kill [ -SIGNAL ] pid ... kill –l SIGNAL 为一个 singal 的数字,从 0 到 31 ,其中 9 是 SIGKILL ,也就是一般用来 杀掉一些无法正常 terminate 的讯号。其馀讯号的用途可参考 sigvec(2)中对 signal 的 说明。你也可以用 kill -l 来察看可代替 signal 号码的数目字。kill 的详细情形请参 阅 man kill。 六. 关於字串处理的指令 1. echo echo 是用来显示一字串在终端机上。□ echo -n 则是当显示完之後不会有跳行的动 作。 2. grep/fgrep grep 为一过滤器,它可自一个或多个档案中过滤出具有某个字串的行,或是自标准 输入过滤出具有某个字串的行。 fgrep 可将欲过滤的一群字串放在某一个档案中,然後使用 fgrep 将包含有属於这 一群字串的行过滤出来。 grep 与 fgrep 的用法如下: grep [-nv] match_pattern file1 file2 .... fgrep [-nv] -f pattern_file file1 file2 ... -n 把所找到的行在行前加上行号列出 -v 把不包含 match_pattern 的行列出 match_pattern 所要搜寻的字串 -f 以 pattern_file 存放所要搜寻的字串 七. 网路上查询状况的指令 1. man 17man 是手册 ( manual ) 的意思。 UNIX 提供线上辅助( on-line help )的功能, man 就 是用来让使用者在使用时查询指令、系统呼叫、标准程式库函式、各种表格等的使用所用 的。man 的用法如下: man [-M path] [[section] title ] ..... man [-M path] -k keyword ... -M path man 所需要的 manual database 的路径。 我们也可以用设定环境变数 MANPATH 的方式来取代 -M 选项。 title 这是所要查询的目的物。 section 为一个数字表示 manual 的分类,通常 1 代表可执行指令,2 代表系统呼叫 ( system call ) ,3 代表标准函数,等等。 我们如要参考 eqnchar(7) 的资料,则我们就输入 man 7 eqnchar ,便能取得我们所要 的辅助讯息。 -k keyword 用来将含有这项 keyword 的 title 列出来。 man 在 UNIX 上是一项非常重要的指令,我们在本讲义中所述之用法均仅只是一个大家 比较常用的用法以及简单的说明,真正详细的用法与说明还是要请你使用 man 来得到。 2. who who 指令是用来查询目前有那些人在线上。 3. w w 指令是用来查询目前有那些人在线上,同时显示出那些人目前的工作。 4. ku ku 可以用来搜寻整个网路上的 user , 不像 w 跟 who 只是针对 local host 的查询. 而且 ku 提供让使用者建立搜寻特定使用者名单的功能。你可以建立一个档案 information-file 以条列的方式存放你的朋友的资料,再建立一个档案 hosts-file 来指 定搜寻的机器名称。 ku 的指令格式可由 ku -h 得到。 八. 网路指令 UNIX 提供网路的连接,使得你可以在各个不同的机器上做一些特殊的事情,如你可以 在系上的 iris 图形工作站上做图形的处理,在系上的 Sun 上读 News ,甚至到学校的计 中去找别系的同学 talk 。这些工作可以利用 UNIX 的网路指令,在你的位子上连到各个 不同的机器上工作。如此一来,即使你在寝室,也能轻易的连至系上或计中来工作,不用 像以前的人必须泡在冷冰冰的机房面。 这些网路的指令如下所述: 181. rlogin 与 rsh rlogin 的意义是 remote login , 也就是经由网路到另外一部机器 login 。 rlogin 的格式是: rlogin host [ -l username ] 选项 -l username 是当你在远方的机器上的 username 和 local host 不同的时後, 必须输入的选项,否则 rlogin 将会假设你在那边的 username 与 localhost 相同,然後 在第一次 login 时必然会发生错误。 rsh 是在远方的机器上执行某些指令,而把结果传回 local host 。rsh 的格式如下: rsh host [ -l username ] [ command ] 如同 rlogin 的参数 -l username , rsh 的 -l username 也是指定 remote host 的 username 。而 command 则是要在 remote host 上执行的指令。如果没有 指定 command , 则 rsh 会去执行 rlogin ,如同直接执行 rlogin 。 不过 rsh 在执行的时候并不会像一般的 login 程序一样还会问你 password , 而是 如果你没有设定 trust table , 则 remote host 将不会接受你的 request 。 rsh 须要在每个可能会做为 remote host 的机器上设定一个档案,称为 .rhosts。这 个档案每一行分为两个部份,第一个是允许 login 的 hostname , 第二个部份则是允许 login 的username 。 例如, 在 ccsun7.csie.nctu.edu.tw 上头你的 username 为 QiangGe , 而你的 home 下面的 .rhost 有以下的一行: ccsun6.cc.nctu.edu.tw u8217529 则在 ccsun6.cc.nctu.edu.tw 机器上的 user u8217529 就可以用以下的方法来执行 rsh 程式: % rsh ccsun7.csie.nctu.edu.tw -l ysjuang cat mbox 将 ysjuang 在 ccsun7.csie.nctu.edu.tw 上的 mbox 档案内容显示在 local host ccsun6.cc.nctu.edu.tw 上。 而如果 .rhost 有这样的一行,则 ccsun6.cc.nctu.edu.tw 上的 user u8217529 将可以不用输入 password 而直接经由 rsh 或 rlogin login 到 ccsun7.csie.nctu.edu.tw 来。 注意: .rhost 是一个设定可以信任的人 login 的表格,因此如果设定不当将会让不法之徒 有可以乘机侵入系统的机会。 如果你阅读 man 5 rhosts ,将会发现你可以在第一栏用 + 来取代任何 hostname ,第二栏用 + 来取代任何 username 。 如一般 user 喜欢偷懒利用 " + username " 来代替列一长串 hostname ,但是这样 将会使得即使有一台 PC 上跑 UNIX 的 user 有与你相同的 username , 也可以得到你的 trust 而侵入你的系统。这样容易造成系统安全上的危险。因此本系禁止使用这样子的方 19式写你的 .rhost 档,如果发现将予以停机直到你找中心的工作人员将其改正为止。 同理, 如果你的第二个栏位为 + , 如"hostname + " ,则你是允许在某一部机器上的"所有"user 可 以不用经由输入 password 来进入你的帐号,是壹种更危险的行为。所以请自行小心。 2. telnet telnet 是一个提供 user 经由网路连到 remote host。 telnet 的格式如下: telnet [ hostname | ip-address ] [ port ] hostname 为一个像 ccsun1 或是 ccsun1.cc.nctu.edu.tw 的 nameaddress, ip-address 则为一个由四个小於 255 的数字组成的 ip address ,如 ccsun1 的 ip-address 为 140.113.17.173 ccsun1.cc.nctu.edu.tw 的 ip-address 为 140.113.4.11 。你可以利用 telnet ccsun1 或telnet 140.113.17.173 来连到 ccsun1。 port 为一些特殊的程式所提供给外界的沟通点, 如资工系的 MUD 其 server 便提 供一些 port 让 user 由这些 port 进入 MUD 程式。详情请参阅 telnet(1)的说明。 3. ftp ftp 的意义是 File Transfer Program ,是一个很常应用在网路档案传输的程式。ftp 的格式如下: ftp [ hostname | ip-address ] 其中 hostname | ip-address 的意义跟 telnet 中的相同。 在进入 ftp 之後,如果与 remote host 连接上了,它将会询问你 username 与密码, 如果输入对了就可以开始进行档案传输。 在 ftp 中有许多的命令,详细的使用方式请参考 ftp(1) ,这里仅列出较常用的 cd , lcd , mkdir , put , mput , get , mget , binary , ascii , prompt , help 与 quit 的 使用方式。 ascii 将传输模式设为 ascii 模式。通常用於传送文字档。 binary 将传输模式设为 binary 模式,通常用於传送执行档,压缩档与影像档等。 cd remote-directory 将 remote host 上的工作目录改变。 lcd [ directory ] 更改 local host 的工作目录。 ls [ remote-directory ] [ local-file ] 列出 remote host 上的档案。 get remote-file [ local-file ] 取得远方的档案。 mget remote-files 可使用通用字元一次取得多个档案。 put local-file [ remote-file] 将 local host 的档案送到 remote host。 mput local-files 可使用通用字元一次将多个档案放到 remote host 上。 help [ command ] 线上辅助指令。 20mkdir directory-name 在 remote host 造一个目录。 prompt 更改交谈模式,若为 on 则在 mput 与 mget 时每作一个档案之传输时均会询 问。 quit/bye 离开ftp . 利用 ftp ,我们便可以在不同的机器上将所需要的资料做转移,某些特别的机器更存 放大量的资料以供各地的使用者抓取,本校较著名的 ftp server 有 NCTUCCCA 与系上的 ftp.csie.nctu.edu.tw 。这些 ftp server 均有提供一个 user 称为 anonymous ,一般 的"外来客"可以利用这个 username取得该 server 的公共资料。不过 anonymous 在询问 password 时是要求使用 anonymous 的使用者输入其 email address,以往有许多台湾的使 用者在使用国外的 ftp server 时并没有按照人家的要求输入其 email address,而仅是随 便打一些字串,引起许多 internet user 和管理者的不满,对台湾的使用者的风评变得很 差,因此遵循各 ftp server 的使用规则也是一件相当重要的事。 九. 关於通讯用的指令 1. write 这个指令是提供使用者传送讯息给另一个使用者,使用方式: write username [tty] 2. talk/ytalk/cytalk/ctalk UNIX 专用的交谈程式。会将萤幕分隔开为你的区域和交谈对象的区域,同时也可和不 同机器的使用者交谈。使用方式: talk username[@host] [tty] 3. mesg 选择是否接受他人的 messege , 若为 messege no 则他人的 messege 将无法传送给 你,同时他也无法干扰你的工作。使用方法: mesg [-n|-y] 4. mail/elm 在网路上的 email 程式,可经由此程式将信件 mail 给他人。 使用方式: mail [username] mail -f mailboxfile 如有信件,则直接键入 mail 可以读取你的 mail . elm 提供较 mail 更为方便的介面,而且可做线上的 alias . 你可以进入 elm 使用上下 左右键来选读取的信件,并可按 h 取得线上的 help 文件。 21使用方式: elm [usernmae] elm -f mailboxfile 十. 编译器( Compiler ) Compiler 的用处在於将你所撰写的程式翻译成一个可执行档案。在资工系常用的程式语 言是 C , pascal , FORTRAN 等。你可以先写好一个 C 或 Pascal 或 FORTRAN 的原始程 式档,再用这些 compiler 将其翻成可执行档。你可以用这个方法来制造你自己的特殊指 令。 1. cc/gcc (C Compiler) /usr/bin/cc /usr/local/bin/gcc 语法: cc [ -o execfile ] source gcc [ -o execfile ] source execfile 是你所希望的执行档的名称,如果没有加上 -o 选项编译出来的可执行档会以 a.out 做为档名。 source 为一个以 .c 做为结尾的 C 程式档。请参阅 cc(1) 的说明。 2. pc (Pascal Compiler) /usr/local/bin/pc 语法: pc [ -o execfile ] source execfile 是你所希望的执行档的名称,如果没有加上 -o 选项编译出来的可执行档会 以 a.out 做为档名。 source 为一个以 .p 做为结尾的 Pascal 程式档。 请参阅 /net/home5/lang/man 中 pc(1) 的说明。 3. f77 (Fortran Compiler) /net/home5/lang/f77 语法: f77 [ -o execfile ] source execfile 是你所希望的执行档的名称,如果没有加上 -o 选项编译出来的可执行档会以 a.out 做为档名。 source 为一个以 .p 做为结尾的 FORTRAN 程式档。 十一. 有关列印的指令 以下为印表所会用到的指令,在本系的印表机有 lp1 , lp2 ( 点矩阵印表机 ), lw , sp , ps , compaq ( 雷射印表机 ),供使用者使用。 221. lpr lpr 为用来将一个档案印至列表机的指令。用法: lpr -P[ printer ] file1 file2 file3 ... 或 lpr -P[ printer ] < file1 例子: lpr -Plp1 hello.c hello.lst hello.map lpr -Plp1 < hello.c 前者以参数输入所要印出的档案内容,後者列印标准输入档案(standard input)的内 容,因已将 hello.c 转向到标准输入,故会印出 hello.c 的档案内容。 2. lpq lpq 是用来观察 printer queue 上的 Jobs 。用法: lpq -P[ printer ] 3. lprm lprm 是用来取消列印要求的指令。 通常我们有时会印错,或是误送非文字档资料至 printer , 此时就必须利用 lprm 取消列印 request ,以免造成资源的浪费。 用法: lprm -P[ printer ] [ Jobs id | username ] lprm 用来清除 printer queue 中的 Jobs , 如果你使用 Job Id 作为参数,则它将此 Job 自 printer queue 清除,如果你用 username 作为参数,则它将此 queue 中所有 Owner 为此 username 的 Jobs 清除。 到这里,我们第二讲的内容就基本结束了,可以说,这一讲是比较无聊的,但它又是 必不可少的。这里列出的仅仅是最最常用的控制台命令,要进一步的熟悉 Linux操作系统, 了解类 UNIX 操作系统的管理思想,我们还有很多要学习,有兴趣的同学可以参看其它的 相关参考书籍。 23 第三讲 Linux下的网络服务,配置问题和 常用工具 这一讲我们会接触到 Linux 下能够提供的一些典型的网络服务,大家会对这些服务有 一个感性的认识,除此之外我们还会看到 Linux下面一些非常重要的配置文件以及他们的用 法。最后我们会看到 Linux 下面最常用的几个工具软件。 一.Linux下的网络服务 一般来说,各种操作系统在网络方面的性能比较是这样的顺序 BSD>Linux>Win NT>Win 9X, 由此说来,Linux 的网络功能仅次于 UNIX,而强于 Win NT 和其它的视窗系 列产品,对于 Win2000我还不能评价太多,因为不是很熟。 Linux 的网络功能除了基本的连线功能如 telnet, ftp, rsh, login, finger等等以外,架设各 种服务器的功能更把 Linux 网络功能发挥的淋漓尽致,下面我大概的为大家介绍一下 Linux 下的各种网络服务。 1. Mail Server Email 现在是网络上最重要的服务了,你可能没有用过 FTP, BBS, INN,但是如果你连电 子邮件都没有用过,那作为 BUPT 的一员,你得自己好好反省一下了。 现在又很多功能强大的 mailserver供你选择,例如 freemail.263.net, hotmail.com, freemail.sohu.com,等等,这些都是免费的。但这是从使用者角度来看,如果你是想为一个局 域网内部提供一个交换电子邮件的服务,那它们对你来说可就是一笔巨款了,再说人家卖 不卖给你还不好说呢。Linux 下面最著名的 mail server是 Sendmail,它是一个负责监控和传 送电子邮件的邮件代理程序,你使用它就可以在在一个小的局域网(例如宿舍网)里提供 一个电子邮件服务,这是多么神奇的事情啊!使用 Linux 下面的 MailServer最大的好处是性 价比高,这些软件的功能强大,却又是完全免费的,我们完全不用去花几万元买一个功能 有限还要按照人头收费的 Exchange Server,或者是使用 D版软件被别人扎脊梁骨。 2. Router 和 Gateway 如果你的计算机可以连接到外面的 Internet 上去, 然而一些可以连接到你这台机器上的 24计算机却只能访问里面的局域网,那么你可以安装 Router或 Gateway的服务,这样别人就 可以通过你的机器和外面的世界联系了。当然了,这么做的前提是你有一颗大公无私的信, 要我就不行,我可舍不得把我的 PIII 的机器贡献给宿舍的网虫们。 3. Samba 在 Windows 横行的今天,Samba 的出现对于 Linux 的茁壮成长是非常重要的,它大大 拓宽了 Linux 的应用领域。Samba 可以提供一种转换 SMB(windows 使用的一种信息格式) 和 NFS(Linux 使用的一种信息格式)的服务,通过 Samba, 运行 Windows的工作站就可以 同运行 Linux 的服务器之间进行通信,还可以 让网络上的使用者(包括 Windows 用户)共 享一台打印机,这样 Linux 的服务器就可以运行在 Windows的环境中了。 4. NFS Server Linux 还可以作为文件服务器,为网络上具有存取权限的 Windows/Linux机器分享相同 的文件系统,这样一来,不论是在 Windows 还是在 Linux 的网络中,Linux 的文件服务器都 能够发挥作用了。 5. Terminal Server 这种服务能够提供 PPP/SLIP Dialup(包括 multi-port,就是一台计算机连多个调制解调器 上网),让一般的民用网络 Moden 使用者可通过 Terminal Server与 Internet连接起来。 6. BBS 在北邮如果你没有上过 BBS(Bulletin Board System电子布告版)我会很吃惊的, 202.112.101.44 或者是202.204.7.235 你至少应该去过一个吧?如果没有去过,那么赶快把这 一课补上。关于 BBS到底能做什么我就不多说了,我假定你已经知道了,现在网络上流行 的免费 BBS版本很多,著名的有 Phoenix,Maple,Firebird,Pivot等等,这些都可以在 Linux 上 使用。另外还有许多基于 WWW 的 BBS,例如著名的跨平台的 Motiff Community,可以非 常稳定的在 Linux 下运行,这是"瘟都死"所不能比拟的。 7. WWW 在 Linux下面也有功能强大的 WWW服务器,你完全可以不必去使用又贵又不稳定的 IIS。但是不可否认 IIS 的操作非常的简单,如果你觉得自己有钱,可以买得起 Win2000 Advanced Server,又出得起"人头税",那你就用"瘟都死"吧。在 Linux 上的 WWW服务程序 很多,现在最著名最流行的是 Apache,在北邮,有许多的服务器就是跑 Apache 的。现在在 Linux 上使用 Apache+PHP+MySQL 是实现动态页面的最佳搭配,立志于搞网站建设的朋友 可一定要留心这一块,因为它可以为你的网站建设节省大笔的成本(现在可是操作系统比 机器贵)。我知道一个讨论组:www.coventive.com.cn/club/default.htm,它就是用 Apache+PHP+MySQL 这种组合建立起来的,有兴趣的朋友可以去看看。 25 二.几种重要的配置文件 Linux 下面的配置文件非常的多,对于初学者来说,我们只需要知道最最常用的几个配 置文件就可以了。由于片符合时间的原因,在这里我只介绍四个非常经典的配置文件 (lilo.conf, passwd,inittab,fasttab),这四个文件中我重点介绍 lilo.conf,其余三个文件会简单的 在课堂上演示。至于 Linux 其它众多的配置文件必须各位同学自己下去查找相关资料自己学 习了。 1. lilo.conf 这是 Linuxloader(lilo)的配置文件。对于初学者来说,这个配置文件是非常重要的,因 为它直接关系到你的系统是否能够正确的引导到 Linux 上来。 我在这里主要将一下如何使用 lilo 实现多个在一台机器上安装多个操作系统。 一般来说,第一次安装 Linux 后,缺省引导的系统Linux,但是对大多数 Linux 用户 来说,他们使用 windows 的时间会多于 Linux,所以我们最好能够将缺省引导的系统改为 windows,这样的话,就省去了每次启动时敲一串字符的麻烦。要修改引导顺序,就要修改 Linux 系统中的一个配置文件,这个文件就是/etc/lilo.conf。我使用的是 Xlinux OS 1.5,用 vi 打开这个文件后,会出现下面的文字: boot=/dev/hda map=/boot/map install=/boot/boot.b prompt timeout=100 linear default=xlinux image=/boot/vmlinuz-2.2.14-5.0 read-only root=/dev/hda4 other=/dev/hda1 label=win 这就是刚刚安装完毕后的 LILO配制文件.这个文件是按照由前到后顺序引用的,通过修 改这个文件就可以改变 lilo 执行时的一些特性.首先我将这个文件中比较重要的几个地方给 大家介绍一下: 首先请看第 5 行:timeout=100,这是一个设置在 lilo 引导缺省的系统之前等候用户输入系 统别名的等候时间长度.它的时长好象不是按秒一级的数量级进行计算的,总之用户可以按 照自己的实际需要设置相应的时长.我一般是设置成 timeout=500. 然后我们看第 7 行:default=xlinux,这里是关键之一!这一行指明缺省引导的系统的别名 26是 xlinux,要想改变系统的缺省引导顺序,这里是需要修改的,稍后就会说到是怎么修改的. 再看第8行到第 11 行,这四行指明了引导 Linux 系统的一些细节. image=/boot/vmlinuz-2.2.14-5.0指明了操作系统核心是放在哪里的,以便于引导程序装载操作 系统核心;label=xlinux指明了引导这个操作系统时用的别名,这里是xlinux; root=/dev/hda4指 明了引导程序需要到哪一个硬盘的第几个分区去寻找 init 过程,在这里是要到第一个硬盘的 第四个分区中去将引导系统的控制权交给这个分区里的 init过程. 最后我们看看文件中的最后两行.other=/dev/hda1说明除了linux操作系统以外,机器中还 安装了别的操作系统(当然我知道这个另外的操作系统是我的 win2000了),它位于第一块硬 盘中的第一个分区,一般来说,这个路径是在安装的时候就设置好的,不需要我们手工修改,但 是我认为知道这些信息还是很有必要的;label=win指明了这个系统引导时使用的别名为win. 因为 lilo 是顺序引用的,所以如果我们想要让缺省引导的系统变成 windows,就需要将这两行 移动到 image=.....那一行之前的位置,我建议的位置是放在 image=...之前和default=.....之后. 这是关键之二! 当你将前面的两个关键步骤完成之后,还需要将default=....那一行改成 default=win,这是 比较重要的一步,虽然即使你不改动这里,系统也可以按照你的想法去引导,但是我可不敢保 证你这样做不会出一点问题.再说,如果你不改动这里那多别扭啊! 做到这里,我们对lilo.conf这个文件的改动就结束了,然后只要退出vi,然后键入 lilo -v -v -v这个命令来更新一下LILO,我们就大功告成了.当你reboot以后,就会发现在"lilo:"那里敲入 回车键后,系统就会缺省的引导到 windows 系统去了. 2. Passwd 这个配置文件是关于用户口令的。如果你是一名系统管理员,有可能会一次新增很多 的用户,这时用 adduser就相当麻烦了。一般有功力的管理员会直接去修改/etc/passwd 文件。 利用 passwd文件,可以控制用户的口令状态及一些个人配置。 对于这个文件,普通单机用户使用的并不是很多,主要是多用户的管理员使用,对于 它的一些基本配置方法,我会在课堂上为同学们演示,这里不再赘述。 3. Inittab和 fasttab 这两个文件都是存放在/etc 这个目录下面的,Inittab 文件用来配置 Linux 初始化的一些 动作,我们最常用的是设定 Linux 的启动方式。Fasttab 文件用来设定一些在 Linux 启动时的 动作,主要是文件系统或者是外设的挂接动作,如果你想让你的 Linux 一开始就能够使用光 盘驱动器,就可以把 mount 指令加到这个文件中去。 因为这两个文件对我们初学者来说,可以利用的地方不是很多,所以我不用过多的文 字来描述它们的功能,具体的操作我会在课堂上为同学们演示,这里不再赘述。 27 三.Linux下常用的工具软件 这里我会为大家介绍 Linux 世界里最常用的几种工具软件,包括:vi, tar, gzip, rpm。 1. 文字编辑 vi 是Linux(UNIX)世界最强大的文本编辑工具,我在第一讲中提到过它,现在我把它的 一些基本使用方法介绍给大家。 Vi 的三种状态 „ Command mode : 控制萤幕游标之移动,字元或游标之删除,搬移复制某 区段及进入 Insert mode 下,或者到 Last line mode 。 „ Insert mode : 唯有在 Insert mode 下, 才可做文字资料输入,按 Esc 键可到 Command mode 。 „ Last line mode : 将档案写入或离开编辑器,亦可设定编辑环境, 如寻找字 串、列出行号..等。 vi 的基本操作 ‹ 进入 vi 1. 在系统提示符号下输入 vi 及档案名称後即进入 vi 全萤幕编辑画面,且在 Command mode 下。 ‹ 切换至 Insert mode 编辑文件: 在 Command mode 下可按 'i' 或 'a' 或 'o' 三键进入 Insert mode。 ‹ 离开 vi 及存档: 在 Command mode 下可按 ':' 键进入 Last line mode, :w filename (存入指定档案) :wq (写入并离开 vi) :q! (离开并放弃编辑的档案) Command mode 下功能键简介 1. 进入 Insert mode i : 插入, 从目前游标所在之处插入所输入之文字。 a : 增加, 目前游标所在之下一个字开始输入文字。 o : 从新的一行行首开始输入文字。 2. 移动游标

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值