大数据文件快速读入内存

//下面是学习power8博客敏感词比赛的时候,用到了他人的代码,在此记录一下,并对分享者表示感谢!
//先把文件读入内存,再对内存文件进行转码等处理,比使用ifstream getline要快n倍!
oid print_as_wide(const char* mbstr)
{
    std::mbstate_t state = std::mbstate_t();
    int len = 1 + std::mbsrtowcs(NULL, &mbstr, 0, &state);
    wchar_t *wstr=(wchar_t *)malloc(sizeof(wchar_t)*(len));
    std::mbsrtowcs(wstr, &mbstr, len, &state);
    //std::wcout << "Wide string: " << &wstr[0] << '\n'
    //           << "The length, including '\\0': " << wstr.size() << '\n';
}
int main(int argc, char *argv[])
{

cout<<"argv =  wordsFile blogFile resultFile"<<endl;


clock_t timeStart = clock();



filebuf *pbuf;  
ifstream filestr;  
long size;  
char * buffer;  
// 要读入整个文件,必须采用二进制打开   
filestr.open ("_blog-mg_out", ios::binary);  
// 获取filestr对应buffer对象的指针   
pbuf=filestr.rdbuf();  

// 调用buffer对象方法获取文件大小  
size=pbuf->pubseekoff (0,ios::end,ios::in);  
pbuf->pubseekpos (0,ios::in);  

// 分配内存空间  
buffer=new char[size];  

// 获取文件内容  
pbuf->sgetn (buffer,size);  

filestr.close();  
// 输出到标准输出  
//cout.write (buffer,size);  



std::setlocale(LC_ALL, "en_US.utf8");
   
    print_as_wide(buffer);


delete []buffer;

WinHex 是一款以通用的 16 进制编辑器为核心,专门用来对付计算机取证、数据恢复、低级数据处理、以及 IT 安全性、各种日常紧急情况的高级工具: 用来检查和修复各种文件、恢复删除文件、硬盘损坏、数码相机卡损坏造成的数据丢失等。得到 ZDNet Software Library 五星级最高评价,拥有强大的系统效用。功能包括 (依照授权类型): - 硬盘, 软盘, CD-ROM 和 DVD, ZIP, Smart Media, Compact Flash, 等磁盘编辑器... - 支持 FAT, NTFS, Ext2/3, ReiserFS, Reiser4, UFS, CDFS, UDF 文件系统 - 支持对磁盘阵列 RAID 系统和动态磁盘的重组、分析和数据恢复 - 多种数据恢复技术 - 可分析 RAW 格式原始数据镜像文件中的完整目录结构,支持分段保存的镜像文件 - 数据解释器, 已知 20 种数据类型 - 使用模板编辑数据结构 (例如: 修复分区表/引导扇区) - 连接和分割、以奇数偶数字节或字的方式合并、分解文件 - 分析和比较文件 - 搜索和替换功能尤其灵活 - 磁盘克隆 (可在 DOS 环境下使用 X-Ways Replica) - 驱动器镜像和备份 (可选压缩或分割成 650 MB 的档案) - 程序接口 (API) 和脚本 - 256 位 AES 加密, 校验和, CRC32, 哈希算法 (MD5, SHA-1, ...) - 数据擦除功能,可彻底清除存储介质中残留数据 - 可导入剪贴板所有格式数据, 包括 ASCII、16 进制数据 - 可进行 2 进制、16 进制 ASCII, Intel 16 进制, 和 Motorola S 转换 - 字符集: ANSI ASCII, IBM ASCII, EBCDIC, (Unicode) - 立即窗口切换、打印、生成随机数字 - 支持打开大于 4 GB 的文件,非常快速,容易使用。 - 广泛的联机帮助 [隐藏介绍]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值