我有一个Web服务器,它将大型二进制文件(几兆字节)读入字节数组。 服务器可能同时读取多个文件(不同的页面请求),所以我正在寻找最优化的方法来做到这一点,而不会对CPU造成过多的负担。 下面的代码是否足够好?
public byte[] FileToByteArray(string fileName)
{
byte[] buff = null;
FileStream fs = new FileStream(fileName,
FileMode.Open,
FileAccess.Read);
BinaryReader br = new BinaryReader(fs);
long numBytes = new FileInfo(fileName).Length;
buff = br.ReadBytes((int) numBytes);
return buff;
}
#1楼
只需用以下内容替换整个内容:
return File.ReadAllBytes(fileName);
但是,如果您担心内存消耗, 则不应该一次性将所有文件都读入内存。 你应该以大块的方式做到这一点。
#2楼
我会这样想:
byte[] file = System.IO.File.ReadAllBytes(fileName);
#3楼
您的代码可以考虑到这一点(代替File.ReadAllBytes):
public byte[] ReadAllBytes(string fileName)
{
byte[] buffer = null;
using (FileStream fs = new FileStream(fileName, FileMode.Open, FileAccess.Read))
{
buffer = new byte[fs.Length];
fs.Read(buffer, 0, (int)fs.Length);
}
return buffer;
}
请注意Integer.MaxValue - Read方法放置的文件大小限制。 换句话说,您一次只能读取2GB的块。
另请注意,FileStream的最后一个参数是缓冲区大小。
一如既往的简单示例程序,以最快的速度分析将是最有益的。
您的底层硬件也会对性能产生很大影响。 您是否使用具有大缓存的服务器硬盘驱动器和带有板载内存缓存的RAID卡? 或者您使用连接到IDE端口的标准驱动器?
#4楼
使用C#中的BufferedStream类来提高性能。 缓冲区是内存中用于缓存数据的字节块,从而减少了对操作系统的调用次数。 缓冲区可提高读写性能。
#5楼
我可能会争辩说这里的答案通常是“不要”。 除非您绝对需要同时使用所有数据,否则请考虑使用基于Stream的API(或读取器/迭代器的某些变体)。 当您有多个并行操作(如问题所示)以最小化系统负载和最大化吞吐量时,这一点尤为重要。
例如,如果要将数据流式传输给调用者:
Stream dest = ...
using(Stream source = File.OpenRead(path)) {
byte[] buffer = new byte[2048];
int bytesRead;
while((bytesRead = source.Read(buffer, 0, buffer.Length)) > 0) {
dest.Write(buffer, 0, bytesRead);
}
}