java 超大文本_文本编辑器打开大(巨型,巨大,大)文本文件

我的意思是100+ MB大; 这样的文本文件可以推挤编辑人员的范围。

我需要浏览一个大的XML文件,但是如果编辑器有错误,则无法浏览。

有什么建议么?

#1楼

技巧和窍门

为什么要使用编辑器仅查看 (大)文件?

在* nix或Cygwin下 ,只需减少使用量即可 。 (有句名言“少即是多,或多或少”,因为“少”代替了以前的Unix命令“更多”,另外还可以向上滚动。)在“少”下搜索和导航类似于Vim,但是没有交换文件和很少的RAM。

GNU的Win32端口更少。 请参阅上面答案的“较少”部分。

佩尔

Perl适用于快速脚本,它的.. (范围触发器)运算符提供了一种很好的选择机制,以限制您必须经历的工作。

例如:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

这将提取从1百万行到2百万行的所有内容,并允许您以更少的成本手动筛选输出。

另一个例子:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

当“正则表达式一”找到某些内容时,此操作开始打印,而当“正则表达式二”找到有趣的块的末尾时,此操作停止。 它可能会找到多个块。 筛选输出...

日志解析器

这是您可以使用的另一个有用的工具。 引用维基百科的文章 :

logparser是一种灵活的命令行实用程序,最初由Microsoft员工Gabriele Giuseppini编写,用于自动化IIS日志记录的测试。 它旨在用于Windows操作系统,并且包含在IIS 6.0资源工具包工具中。 logparser的默认行为类似于“数据处理管道”,方法是在命令行上获取SQL表达式,然后输出包含与该SQL表达式匹配的行。

Microsoft将Logparser描述为功能强大的多功能工具,它提供对基于文本的数据(例如日志文件,XML文件和CSV文件)以及Windows操作系统上的关键数据源(例如事件日志,注册表,文件系统和Active Directory。 输入查询的结果可以在基于文本的输出中自定义格式,或者可以持久保存到SQL,SYSLOG或图表等更特殊的目标。

用法示例:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

尺寸的相对性

100 MB不太大。 3 GB越来越大。 我曾经在打印和邮件设施工作,该设施创造了美国一流邮件的2%。 我担任技术负责人的系统之一占邮件总数的15%以上。 我们到处都有一些大文件要调试。

和更多...

请随时在此处添加更多工具和信息。 这个答案是社区Wiki的一个原因! 我们都需要更多有关处理大量数据的建议...

#2楼

免费的只读查看器:

glogg (Windows,macOS,Linux)–已确认可处理多GB文件。 它的主要功能是正则表达式搜索。 具有选项卡,可以直接从磁盘读取文件,可以监视/关注文件,并允许用户标记行。

LogExpert (Windows)–“ GUI替代tail 。” 支持文件跟踪,搜索,过滤,可配置的突出显示,插件和外部工具。

大文本文件查看器 (Windows)–极简主义,可执行文件很小。 支持拆分视图,文本主题自定义,正则表达式搜索和文件关注。

Lister (Windows)–更加小巧和简约。 它是一个可执行文件,只有500 KB,但仍支持搜索(使用正则表达式),打印,十六进制编辑器模式和设置。

loxx (Windows)–支持以下,突出显示,行号,大文件,正则表达式,多个文件和视图等等。 免费版本有一些限制。

免费编辑:

Vim和Emacs (Windows,macOS,Linux)–经典Unix编辑器。 学习曲线陡峭,但效率很高。 它们的设置可以调整以使其更快。

大型文件编辑器 (Windows)–打开和编辑TB +文件,支持Unicode,使用很少的内存,具有XML特定的功能,并包括二进制模式。

HxD (Windows)–十六进制编辑器,而不是文本编辑器; 但是它非常快而且有用。

GigaEdit (Windows)–支持搜索,字符统计和字体自定义。 但这是有问题的–对于大文件,它仅允许覆盖字符,而不能插入字符; 它不将LF视为行终止符,而仅将CRLF视为行终止符。 而且很慢

内置程序(无需安装):

less (macOS,Linux)–传统的Unix命令行传呼工具。 使您可以查看几乎任何大小的文本文件。 也可以安装在Windows上。

记事本 (Windows)–较大的文件比较合适,尤其是在自动换行功能关闭的情况下。

MORE (Windows)–这是指Windows MORE ,而不是Unix more 。 一个控制台程序,使您可以一次查看一个屏幕的文件。

网络浏览器:

htmlpen.com –可以打开和语法突出显示TB +文件。 允许编辑,但非常大的文件除外。 支持搜索,正则表达式和导出。

readfileonline.com –另一个HTML5大文件查看器。 支持搜索。

付费编辑:

010编辑器 (Windows,macOS,Linux)–打开巨大的文件(多达50 GB)。

SlickEdit (Windows,macOS,Linux)–打开大文件。

UltraEdit (Windows,macOS,Linux)–打开大于6 GB的文件,但必须对其进行更改才能使其实用:菜单»高级»配置»文件处理»临时文件»打开不带临时文件的文件...

EmEditor (Windows)–很好地处理非常大的文本文件(官方最多可处理248 GB,但根据一份报告则可处理多达900 GB)。

最后,您是否尝试过使用常规编辑器打开大文件? 一些编辑器实际上可以处理相当大的文件。 特别是, Notepad ++ (Windows)和Sublime Text (Windows,macOS,Linux)支持2 GB范围内的文件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值