系列:关于TXT的文件格式

0x00前言

本篇文章起始于本人在与群内的大佬了解关于wav解析的一个说明与讨论。于是本人就想要组成一个关于常用的文件格式的介绍,方便后续的各个小软件的解析。

这里第一个介绍的就是最简单的txt文本格式的文件,这个文件也是最简单的文件格式了。所以先在这边作为开胃小菜,先行介绍。

技能熟练度
数据结构了解

0X21 ASCII

首先,人类需要在计算机内进行信息的交流。

起初,因为地域的问题,程序员们使用了较为简单粗暴的方式进行交流:做一个文件,然后往里面写入字符,只要我约定了1这个字符具体的表示形式,那么大家都可以知道这个字符是1了。

于是出现了现有的第一个公认的字符编码表:ASCII

wiki

这里规定了一个基础的字符的定义。与其对应的十六进制与二进制的编码方式。其中,ASCII码对于字符做出了两个具体的分类:”可见字符“、”特殊字符“

两者中,可见字符占据绝大多数,而特殊字符现在比较常用的主要是LF和CR以及ESC。大部分的参数都是给了一些古老的程序协议和文件执行的便利性。其中,LF是在类UNIX下的常用的换行符,一般使用在UNIX下。而CR是MAC OS下的回车案件,也是一个常用的字符。而CR/LF在Windows下常用,所以也能在Windows下查看UNIX和MAC OS下的文件。

下面就是一个典型的text文件

img

可以看到,text文件某种意义上等价于bin文件,也是当前系统组成下的最简单的文件编码之一(还有一个就是bin文件了)。也是因为它是最为简单的对于人类友好的文本格式了。而与之衍生的富文本格式就是一种加入了特殊格式的文本格式。

其实某种程度上来讲,之前盛行、笔者正在使用的markdown的写法就是一种富文本格式,只不过将原本我们不可见的文本格式特殊字符作为了可见的字符定义,让当前的格式可以直接使用键盘输入的方式进行输入,也方便的大家快速的输入格式。

0X30 富文本格式

普通的一个文档是一个简单的文本格式,而富文本格式就是使用自定义的软件对于当前字符进行特定的编码以完成图片或者是字符颜色的自定义。markdown就是及其经典的代表。也是很容易讲清楚的富文本格式,这里十分感谢发明者。

[一个特定的转换网页](www.abcde.engineer)

一个特定的转换网页

这个就是最简单的一个对于网页的富文本定义。可以看到,markdown使用[网页显示名称](网页实际链接)的特殊方式进行定义。并且依靠转换器进行人类友好的方式进行转换。

至于其他的编码格式,也都是如此。

0x40 更多

本文首发自 系列:关于TXT的文件格式,更多文章可进入我的博客详查。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

GreenDreamer

如果帮到了你,还望请我喝杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值