9.5 应用:文本编辑器
本节将多重链表应用于编辑缓冲ADT(Edit Buffer ADT)。
9.5.1 编辑操作
布局
通常将文本以行和列的形式组织起来。每一行有无限的长度,每一行的大小可能不同,但末尾都有换行符。一个空的文本,只有一行空行以及一个换行符。
文本光标
文本光标由行号以及字符的偏移量(应该就是列号)来决定,其可以在文本的任何区域内移动,但只限于当前位置存在字符的情况下。文本光标的移动至少要有以下三种:
- 竖直移动,即移动到另外移动相同偏移量的位置,如果移动到的行较短,则移至该行末尾;
- 水平移动,即在一行内向前或向后移动,在移动到一行的起始字符之前时,自动将光标移至上一行末尾,在移动到一行的结尾字符之后时,自动将光标移至下一行的起始位置;
- 移动至文件首尾或者行首尾。
有两种模式,分别为插入模式和改写模式。在插入模式的情况下,文本光标之后直至该行换行符之前的字符都向后移动,再在文本光标右侧插入字符,随着字符的插入,文本光标也向后移动。在改写模式下,将文本光标右侧紧邻的字符替换,也是随着字符替换的进行,文本光标也随之向后移动。
此外,还需考虑换行符的问题,在换行符前插入字符,则该行自动延伸;在换行符之后插入字符,即在下一行的起始字符之前插入字符;当插入一个换行符时,当前行分为两半,在文本光标之前的算作新的一行,在文本光标之后到原来行的换行符之前也是新的一行。
删除文本
分为删除操作和擦掉操作(rub-out),分别对应于键盘上的Delete和Backspace。删除操作,文本光标所在的字符被删除,光标位置不变;而擦掉操作,则是文本光标之前的一个字符被删除,光标位置向前移动一个位置。
与插入文本类似,删除文本也要考虑换行符的问题。删除换行符时,当前行与下一行合并成一行。
9.5.2 编辑缓冲ADT
应具有如下方法:
- EditBuffer():创建空文档,含有一个空行以及一个换行符,此时文本光标处于空行的起始位置,输入模式是插入模式;
- numLines():返回总行数;
- numChars():返回文本光标所在行的字符数(包括换行符);
- lineIndex():返回文本光标所在行的行号;
- columnIndex():返回文本光标所在列的列号;
- setEntryMode(insert):设定输入模式,根据insert是True还是False,确定输入模式是插入模式还是改写模式;
- toggleEntryMode():切换输入模式,根据当前输入模式来改变;
- inInsertMode():确定当前输入模式是否是插入模式;
- getChar():返回文本光标所在位置的字符;
- getLine():返回文本光标所在行的所有内容(包括换行符),以字符串形式返回;
- moveUp(num):文本光标的竖直移动,如前所述,若num为负,文本光标不移动;
- moveDown(num):同上,方向相反;
- moveDocHome():将文本光标移至文档开头;
- moveDocEnd():将文本光标移至文档结尾;
- moveLeft():文本光标的水平移动,如前所述;
- moveRight():同上,方向相反;
- moveLineHome():将文本光标移动至当前行的开头;
- moveLineEnd():将文本光标移动至当前行的结尾;
- breakLine():在文本光标位置另起一行,如前所述,当插入换行符时,文本光标之后到原来的换行符之前的字符组成新的一行,文本光标也移动至该行起始位置;
- deleteLine():删除文本光标所在行的所有内容,文本光标移动至下一行的起始位置,如果删除的是最后一行,文本光标则移动至上一行的末尾;
- truncateLine():删除文本光标所在行,从文本光标位置起到该行结束前的所有字符,换行符不删除,文本光标移动至该行末尾;
- addChar(char):将字符char插入,根据输入模式来进行,另外还要考虑此时文本光标位置和插入字符是否是换行符的问题,如前所述;
- deleteChar():按删除模式,将文本光标所在位置的字符删除,文本光标位置不变;
- ruboutChar():按擦除模式,将文本光标之前的字符删除,文本光标向前移动一个位置,注意删除的是换行符的情况;
- deleteAll():将文本所有字符删除,返回至空文本状态(一个空行和一个换行符)。
我们使用python列表的双链表来实现,每一行的内容都储存在一个python列表中,而这一个python列表都储存在双链表的一个结点中,如下图所示:
#-*-coding: utf-8-*-
# 编辑缓冲ADT
class EditBuffer(object):
# 创建空文档
def __init__(self):
self._firstLine = _EditBufferNode(['\n']) # 双链表的头指针
self._lastLine = self._firstLine # 双链表的尾指针
self._curLine = self._firstLine # 文本光标所在行,其实质是双链表中的外部指针
self._curLineNdx = 0 # 文本光标所在行行号
self._curColNdx = 0 # 文本光标所在列列号,其实质是python列表的索引
self._numLines = 1 # 记录文本当前总行数
self._insertMode = True # 当前输入模式是否是插入模式
# 返回总行数
def numLines(self):
return self._numLines
# 返回文本光标所在行的字符数
def numChars(self):
return len(self._curLine.text)
# 返回文本光标所在行的行号
def lineIndex(self):
return self._curLineNdx
# 返回文本光标所在列的列号
def columnIndex(self):
return self._curColNdx
# 设定输入模式,根据insert是True还是False,选择输入模式
def setEntryMode(self, insert):
self._insertMode = insert
# 切换输入模式
def toggleEntryMode(self):
self._insertMode = not self._insertMode
# 判断输入模式是否是插入模式
def inInsertMode(self):
return self._insertMode == True
# 返回文本光标所在位置的字符
def getChar(self):
return self._curLine.text[self._curColNdx]
# 返回文本光标所在行的内容,以字符串形式返回
def getLine(self):
lineStr = ''
for char in self._curLine.text:
lineStr += char
return lineStr
# 文本光标向上移动
def moveUp(self, nlines):
if nlines <= 0: # 移动行数必须是正数
return
elif self._curLineNdx - nlines < 0: # 向上移动不能超过第一行
nlines = _curLineNdx
for i in range(nlines):
self._curLine = self._curLine.prev # 向上移动
self._curLineNdx -= nlines # 行号也随之调整
if self._curColNdx >= self.numChars(): # 要移动到的行,其总字符数小于文本光标所在列号,自动将文本光标移动至行末尾。
self.moveLineEnd()
# 文本光标向左移动
def moveLeft(self):
if self._curColNdx == 0: # 此时文本光标处于一行的开头,文本光标移动至上一行末尾
if self._curLineNdx > 0:
self.moveUp(1)
self.moveLineEnd()
else:
self._curColNdx -= 1
# 将文本光标移动至文档开头
def moveLineHome(self):
self._curColNdx = 0
# 将文本光标移动至文档末尾
def moveLineEnd(self):
self._curColNdx = self.numChars() - 1
# 从文本光标另起一行
def breakLine(self):
nlContents = self._curLine.text[self._curColNdx:]
del self._curLine.text[self._curColNdx:]
self._curLine.text.append('\n')
self._insertNode(self._curLine, nlContents)
self._curLine = newLine
self._curLineNdx += 1
self._curColNdx = 0
# 输入字符,注意换行符
def addChar(self, char):
if char == '\n':
self.breakLine()
else:
ndx = self._curColNdx
if self.inInsertMode():
self._curLine.text.insert(ndx, char)
else:
if self.getChar() == '\n': # 换行符不能被改写
self._curLine.text.insert(ndx, char)
else:
self._curLine.text[ndx] = char
self._curColNdx += 1
# 删除文本光标之前的字符
def deleteChar(self):
if self.getChar() != '\n':
self._curLine.text.pop(self._curColNdx)
else:
if self._curLine is self._lastLine:
return
else:
nextLine = self._curLine.next
self._curLine.text.pop()
self._curLine.text.extend(nextLine.text)
self._removeNode(nextLine)
class _EditBufferNode(object):
def __init__(self, text):
self.text = text
self.prev = None
self.next = None
构造器,创建空文档,并初始化各参数,_firstLine和_lastLine分别是双链表的头指针和尾指针,分别代表着文档的第一行和最后一行。_curLine和_curColNdx则决定着文档光标的位置,前者决定文本光标所在行,后者决定文本光标所在列。_numLines记录文档当前总行数,_insertMode记录当前输入模式是否是插入模式。
文本光标移动,注意不要超过范围。
修改缓冲区,即编辑文档,具体包括插入字符和删除字符,注意换行符的问题。
最后要注意breakLine()方法,其目的是在文本光标当前所在处另起一行,将该行之后的文本全部转移至新的一行。