1 打开和关闭一个文件
类方法File.new 打开一个文件,并将它实例化为一个File对象,他的第一个参数是文件名.
可选的第二个参数叫做 mode string(这个也是从c得来的).他的意思是怎样打开一个文件(读,写或者其他的).默认是'r'(也就是读).
另外一种new的形式是三个参数的,其中第二个参数是指定了这个文件的原始的权限(经常表示为一个八进制的数).第三个参数是一系列Ored标志的组合.标志是个常量比如File:CREAT(如果文件不存在则创建它)和File:RDONLY(以只读方式打开文件)。不过这种形式很少使用:
出于对操作系统和运行环境的考虑,如果你打开了一个文件的话,你就必须关闭它。当你打开一个文件用于写时,你更应该这样做,从而才能免于丢失数据.close方法就是关闭一个文件:
这里还有一个open方法,它的最简单的形式是和new同义的:
但是open方法还能够带一个block作为参数,当存在block时,打开的文件将会做为一个参数传递给block.这时这个文件将会在这个block的作用域里,保持打开,直到block结束时,自动关闭:
2 更新文件
假设我们想要打开一个文件用于读和写,简单的加一个'+'号到file mode就行了:
3 追加一个文件
假设我们想要追加一段信息到一个存在文件,当我们打开文件时使用'a'作为file mode就行了:
4随机存取一个文件
如果你想随即存取一个文件,你能够使用seek方法,它是File从Io继承而来的.它的最简单的使用就是指定一个字节位置.这个位置是相对于文件开始的位置(开始的位置是0):
如果你能确定每一行都是固定的长度,你就能seek指定的行:
如果你想做一个相对的搜索,你就要使用第二个参数,常量 IO::SEEK_CUR表示当前的位置,而第一个参数则就是相对于当前位置的偏移量(可能是负数):
你也能从文件的结束位置开始搜索:
方法tell得到文件的当前位置,pos是它的别名:
rewind方法将会将文件指针的位置设回到开始的位置,也就是0.
5 操作二进制文件
在很久以前,c语言通过在file mode后附加一个'b'来表示将文件用二进制模式打开.在今天,二进制文件的处理已经没有那么麻烦了。在ruby中,一个字符串很容易保存一个二进制数据,而且也不用通过任何特殊的方式来读文件.
可是在windows下是例外,在他下面,二进制文件和文本文件的不同是,在二进制mode下,结束行不能被转义为一个单独的换行,而是被保存为一个回车换行对.
另外的不同是,在文本模式下 control-Z被作为文件的结束:
这边注意,这些代码都是在windows下才会打印出后面的结果,如果是在linux两处都会打印出11.
再看下面的代码:
binmode方法能够转换当前的流为二进制模式,这边要注意的是,一旦切换过去,就不能切换回来了:
如果你想使用更底层的输入输出,那你可以选择sysread和syswrite方法,他们接受一定数量的字节作为参数 .
如果文件指针已经到达文件的结尾时,sysread方法将会抛出一个异常.
这边要注意 Array 的pack和string的unpack方法,对于处理二进制数据非常有用.
6 文件锁
操作系统提供文件锁,File的flock方法将会锁或者解锁一个文件,它的参数是下面的实例中的任意一个. File::LOCK_EX, File::LOCK_NB, File::LOCK_SH, File::LOCK_UN,或者用逻辑操作符or来组合这些实例.
7 执行简单的io
你已经很熟悉kernel模块中的一些io方法,这些方法都是没有接收者的。比如gets,puts,还有p.
除了上面我们已经说过的那些方法,还有几个方法需要记住的。putc方法输出一个单独的字符,如果给定字符串,将字符串的第一个字符将会被输出:
这边有一个问题,这些方法都没有接收者,那么他们的输出去那里了?在ruby中对应于unix的三个标准io流也有三个常量,他们分别是,STDIN, STDOUT,和 STDERR。他们是类型IO的全局变量.
这边还有一个全局变量叫做 $stdout,它是kernel中的所有输出方法的目的地, $stdout能够随时被指向其他的一些io对象:
除了gets方法,kernel还有readline和readlines方法用于输入.readline的格式和gets相似,除了在文件结尾时,它会返回一个 EOFError ,而gets则是返回nil. readlines方法则是相当于 IO.readlines.
输入是从那儿来的呢?这里有一个标准的输入流 $stdin,默认是 STDIN.同样的这里还有一个错误流($stderr defaulting to STDERR).
这里还有一个全局变量ARGF,它表示一连串的命令行所有文件名,他不是一个真正的file对象:
从标准输入读取将会绕过ARGF方法:
8 执行缓冲和非缓冲的IO
ruby一般使用他自己内置的缓冲:
如果你运行这个程序,你将会注意到hello,和Goodbye!\n在sleep之后同时打印到屏幕,而且Hello...后面并没有换行符.
我们这时可以使用flush方法来来刷新缓冲区,在这里我们使用 $defout作为接收者:
sync= 方法可以关闭缓冲,sync则可以返回此时的是否有缓冲:
这里还有一个更底层的缓冲操作,getc方法返回一个字符,ungetc则将一个字符压回流:
这里注意,这个缓冲和上面所说的并不一样,比如sync= false并不能关掉上面的缓冲。ungetc将不能在比如sysread方法里使用,因为sysread是一个没有缓冲的读操作.
9操作文件的权限和所有权
为了得到一个文件的权限和所有者,我们能够是用File的uid和gid方法:
类File::Stat 有一个实力方法mode,它返回文件的权限:
File的chown方法能够改变一个文件的拥有者和组id:
chmod 方法能够改变一个文件的权限:
我们经常需要知道某个文件,我们是否有读或者写的权限,我们可以使用File::Stat类的一些实例方法:
有时我们需要区分有效的用户id,和实际的用户id,我们可以使用readable_real?, writable_real?, 和 executable_real?:
可以通过比较当前进程的有效用户ID(和组ID)来测试文件的所有权,File::Stat类有实例方法 owned?和grpowned?
注意这些方法,很多在FileTest里面也有:
和进程联系在一起的umask方法决定了一个新的文件的初始权限.(unmask的具体含义去网上搜索搜索就有了).
可以通过File的类方法unmask方法来获取umask。如果指定一个参数,则umask将会被设置为这个,并且将会返回原来的umask:
10 得到和设置时间戳信息
ruby所能理解的时间戳分三种,修改时间,访问时间和改变时间.
mtime, atime和ctim分别返回这三种时间:
如果正好创建了file实例或者File:;Stat实例,则可以使用实例方法:
文件的访问和修改时间能够通过utime来修改:
由于他是同时改变两个时间,因此如果你想只改变一个的话,就要先保存:
类方法File.new 打开一个文件,并将它实例化为一个File对象,他的第一个参数是文件名.
可选的第二个参数叫做 mode string(这个也是从c得来的).他的意思是怎样打开一个文件(读,写或者其他的).默认是'r'(也就是读).
file1 = File.new("one") # Open for reading
file2 = File.new("two", "w") # Open for writing
另外一种new的形式是三个参数的,其中第二个参数是指定了这个文件的原始的权限(经常表示为一个八进制的数).第三个参数是一系列Ored标志的组合.标志是个常量比如File:CREAT(如果文件不存在则创建它)和File:RDONLY(以只读方式打开文件)。不过这种形式很少使用:
file = File.new("three", 0755, File::CREAT|File::WRONLY)
出于对操作系统和运行环境的考虑,如果你打开了一个文件的话,你就必须关闭它。当你打开一个文件用于写时,你更应该这样做,从而才能免于丢失数据.close方法就是关闭一个文件:
out = File.new("captains.log", "w")
# Process as needed...
out.close
这里还有一个open方法,它的最简单的形式是和new同义的:
trans = File.open("transactions","w")
但是open方法还能够带一个block作为参数,当存在block时,打开的文件将会做为一个参数传递给block.这时这个文件将会在这个block的作用域里,保持打开,直到block结束时,自动关闭:
File.open("somefile","w") do |file|
file.puts "Line 1"
file.puts "Line 2"
file.puts "Third and final line"
end
2 更新文件
假设我们想要打开一个文件用于读和写,简单的加一个'+'号到file mode就行了:
f1 = File.new("file1", "r+")
# Read/write, starting at beginning of file.
f2 = File.new("file2", "w+")
# Read/write; truncate existing file or create a new one.
f3 = File.new("file3", "a+")
# Read/write; start at end of existing file or create a
# new one.
3 追加一个文件
假设我们想要追加一段信息到一个存在文件,当我们打开文件时使用'a'作为file mode就行了:
logfile = File.open("captains_log", "a")
# Add a line at the end, then close.
logfile.puts "Stardate 47824.1: Our show has been canceled."
logfile.close
4随机存取一个文件
如果你想随即存取一个文件,你能够使用seek方法,它是File从Io继承而来的.它的最简单的使用就是指定一个字节位置.这个位置是相对于文件开始的位置(开始的位置是0):
# myfile contains only: abcdefghi
file = File.new("myfile")
file.seek(5)
str = file.gets # "fghi"
如果你能确定每一行都是固定的长度,你就能seek指定的行:
# Assume 20 bytes per line.
# Line N starts at byte (N-1)*20
file = File.new("fixedlines")
file.seek(5*20) # Sixth line!
# Elegance is left as an exercise.
如果你想做一个相对的搜索,你就要使用第二个参数,常量 IO::SEEK_CUR表示当前的位置,而第一个参数则就是相对于当前位置的偏移量(可能是负数):
file = File.new("somefile")
file.seek(55) # Position is 55
file.seek(-22, IO::SEEK_CUR) # Position is 33
file.seek(47, IO::SEEK_CUR) # Position is 80
你也能从文件的结束位置开始搜索:
file.seek(-20, IO::SEEK_END) # twenty bytes from eof
方法tell得到文件的当前位置,pos是它的别名:
file.seek(20)
pos1 = file.tell # 20
file.seek(50, IO::SEEK_CUR)
pos2 = file.pos # 70
rewind方法将会将文件指针的位置设回到开始的位置,也就是0.
5 操作二进制文件
在很久以前,c语言通过在file mode后附加一个'b'来表示将文件用二进制模式打开.在今天,二进制文件的处理已经没有那么麻烦了。在ruby中,一个字符串很容易保存一个二进制数据,而且也不用通过任何特殊的方式来读文件.
可是在windows下是例外,在他下面,二进制文件和文本文件的不同是,在二进制mode下,结束行不能被转义为一个单独的换行,而是被保存为一个回车换行对.
另外的不同是,在文本模式下 control-Z被作为文件的结束:
# Create a file (in binary mode)
File.open("myfile","wb") {|f| f.syswrite("12345\0326789\r") }
# Above note the embedded octal 032 (^Z)
# Read it as binary
str = nil
File.open("myfile","rb") {|f| str = f.sysread(15) }
puts str.size # 11
# Read it as text
str = nil
File.open("myfile","r") {|f| str = f.sysread(15) }
puts str.size # 5
这边注意,这些代码都是在windows下才会打印出后面的结果,如果是在linux两处都会打印出11.
再看下面的代码:
# Input file contains a single line: Line 1.
file = File.open("data")
line = file.readline # "Line 1.\n"
puts "#{line.size} characters." # 8 characters
file.close
file = File.open("data","rb")
line = file.readline # "Line 1.\r\n"
puts "#{line.size} characters." # 9 characters 二进制模式的结尾是一个回车换行对.
file.close
binmode方法能够转换当前的流为二进制模式,这边要注意的是,一旦切换过去,就不能切换回来了:
file = File.open("data")
file.binmode
line = file.readline # "Line 1.\r\n"
puts "#{line.size} characters." # 9 characters
file.close
如果你想使用更底层的输入输出,那你可以选择sysread和syswrite方法,他们接受一定数量的字节作为参数 .
input = File.new("myfile",'a+')
output = File.new("outfile",'a+')
instr = input.sysread(10);
puts instr
bytes = output.syswrite("This is a test.")
如果文件指针已经到达文件的结尾时,sysread方法将会抛出一个异常.
这边要注意 Array 的pack和string的unpack方法,对于处理二进制数据非常有用.
6 文件锁
操作系统提供文件锁,File的flock方法将会锁或者解锁一个文件,它的参数是下面的实例中的任意一个. File::LOCK_EX, File::LOCK_NB, File::LOCK_SH, File::LOCK_UN,或者用逻辑操作符or来组合这些实例.
file = File.new("somefile")
file.flock(File::LOCK_EX) # 排他锁; 一个时刻只能有一个进程获得锁。
file.flock(File::LOCK_UN) # 现在解锁。
file.flock(File::LOCK_SH) #共享锁,一个时刻,可以有多个进程获得给定文件的锁。
file.flock(File::LOCK_UN) # 解锁
locked = file.flock(File::LOCK_EX | File::LOCK_NB)
#lock_nb表示加锁时不阻塞,因此这边将会返回false
7 执行简单的io
你已经很熟悉kernel模块中的一些io方法,这些方法都是没有接收者的。比如gets,puts,还有p.
除了上面我们已经说过的那些方法,还有几个方法需要记住的。putc方法输出一个单独的字符,如果给定字符串,将字符串的第一个字符将会被输出:
putc(?\n) # Output a newline
putc("X") # Output the letter X
这边有一个问题,这些方法都没有接收者,那么他们的输出去那里了?在ruby中对应于unix的三个标准io流也有三个常量,他们分别是,STDIN, STDOUT,和 STDERR。他们是类型IO的全局变量.
这边还有一个全局变量叫做 $stdout,它是kernel中的所有输出方法的目的地, $stdout能够随时被指向其他的一些io对象:
diskfile = File.new("foofile","w")
puts "Hello..." # prints to stdout
$stdout = diskfile
puts "Goodbye!" # prints to "foofile"
diskfile.close
$stdout = STDOUT # reassign to default
File.open("foofile","r") do |file|
p file.gets
end
puts "That's all." # prints to stdout
除了gets方法,kernel还有readline和readlines方法用于输入.readline的格式和gets相似,除了在文件结尾时,它会返回一个 EOFError ,而gets则是返回nil. readlines方法则是相当于 IO.readlines.
输入是从那儿来的呢?这里有一个标准的输入流 $stdin,默认是 STDIN.同样的这里还有一个错误流($stderr defaulting to STDERR).
这里还有一个全局变量ARGF,它表示一连串的命令行所有文件名,他不是一个真正的file对象:
# Read all files, then output again
puts ARGF.read
# Or more memory-efficient:如果想要使用这个模式,则需要将上面的代码注释掉.
while ! ARGF.eof?
puts ARGF.readline
end
# Example: ruby cat.rb file1 file2 file3
从标准输入读取将会绕过ARGF方法:
# Read a line from standard input
str1 = STDIN.gets
# Read a line from ARGF
str2 = ARGF.gets #将会什么也读不到
# Now read again from standard input
str3 = STDIN.gets
8 执行缓冲和非缓冲的IO
ruby一般使用他自己内置的缓冲:
print "Hello... "
sleep 10
print "Goodbye!\n"
如果你运行这个程序,你将会注意到hello,和Goodbye!\n在sleep之后同时打印到屏幕,而且Hello...后面并没有换行符.
我们这时可以使用flush方法来来刷新缓冲区,在这里我们使用 $defout作为接收者:
print "Hello... "
STDOUT.flush
sleep 10
print "Goodbye!\n
sync= 方法可以关闭缓冲,sync则可以返回此时的是否有缓冲:
buf_flag = $defout.sync # true
STDOUT.sync = false
buf_flag = STDOUT.sync # false
这里还有一个更底层的缓冲操作,getc方法返回一个字符,ungetc则将一个字符压回流:
ch = mystream.getc # ?A
mystream.ungetc(?C)
ch = mystream.getc # ?C
这里注意,这个缓冲和上面所说的并不一样,比如sync= false并不能关掉上面的缓冲。ungetc将不能在比如sysread方法里使用,因为sysread是一个没有缓冲的读操作.
9操作文件的权限和所有权
为了得到一个文件的权限和所有者,我们能够是用File的uid和gid方法:
data = File.stat("somefile")
owner_id = data.uid
group_id = data.gid
类File::Stat 有一个实力方法mode,它返回文件的权限:
perms = File.stat("somefile").mode
File的chown方法能够改变一个文件的拥有者和组id:
uid = 201
gid = 10
File.chown(uid, gid, "alpha", "beta")
f1 = File.new("delta")
f1.chown(uid, gid)
f2 = File.new("gamma")
f2.chown(nil, gid) # Keep original owner id
chmod 方法能够改变一个文件的权限:
File.chmod(0644, "epsilon", "theta")
f = File.new("eta")
f.chmod(0444)
我们经常需要知道某个文件,我们是否有读或者写的权限,我们可以使用File::Stat类的一些实例方法:
info = File.stat("/tmp/secrets")
rflag = info.readable?
wflag = info.writable?
xflag = info.executable?
有时我们需要区分有效的用户id,和实际的用户id,我们可以使用readable_real?, writable_real?, 和 executable_real?:
info = File.stat("/tmp/secrets")
rflag2 = info.readable_real?
wflag2 = info.writable_real?
xflag2 = info.executable_real?
可以通过比较当前进程的有效用户ID(和组ID)来测试文件的所有权,File::Stat类有实例方法 owned?和grpowned?
注意这些方法,很多在FileTest里面也有:
rflag = FileTest::readable?("pentagon_files")
# Other methods are: writable? executable? readable_real?
writable_real?
# executable_real? owned? grpowned?
# Not found here: uid gid mode
和进程联系在一起的umask方法决定了一个新的文件的初始权限.(unmask的具体含义去网上搜索搜索就有了).
可以通过File的类方法unmask方法来获取umask。如果指定一个参数,则umask将会被设置为这个,并且将会返回原来的umask:
File.umask(0237) # Set the umask
current_umask = File.umask # 0237
10 得到和设置时间戳信息
ruby所能理解的时间戳分三种,修改时间,访问时间和改变时间.
mtime, atime和ctim分别返回这三种时间:
t1 = File.mtime("somefile")
# Thu Jan 04 09:03:10 GMT-6:00 2001
t2 = File.atime("somefile")
# Tue Jan 09 10:03:34 GMT-6:00 2001
t3 = File.ctime("somefile")
# Sun Nov 26 23:48:32 GMT-6:00 2000
如果正好创建了file实例或者File:;Stat实例,则可以使用实例方法:
myfile = File.new("somefile")
t1 = myfile.mtime
t2 = myfile.atime
t3 = myfile.ctime
info = myfile.stat
t1 = info.mtime
t2 = info.atime
t3 = info.ctime
文件的访问和修改时间能够通过utime来修改:
today = Time.now
yesterday = today - 86400
File.utime(today, today, "alpha")
File.utime(today, yesterday, "beta", "gamma")
由于他是同时改变两个时间,因此如果你想只改变一个的话,就要先保存:
mtime = File.mtime("delta")
File.utime(Time.now, mtime, "delta")