在网络安全的世界中,经常会遇到各种格式的数据,比如二进制,比如说16进制,URL编码,HTML编码,Unicode编码,Base格式的编码。网络安全运营一个明确的目标就是把这些不同的数据格式换成为可读的字符串,解读其本意,本文将探索一下ChatGPT/AI在这方面的能力。
通过本文的实际使用,大家可以和之前的文章《Cyberchef 辅助网络安全运营-数据格式转换》,这里,进行对比,根据需要具体确定在工作和学习过程中哪种方式更符合自己的需求。
Binary
将如下的二进制转换成为对应的字符串:
010000110101001101000100010011101110011010011101100100011110010010111000101011011110010110110000100100011110010110111001101101001110011110011010100001001110010110001101100110101110010110101110101000101110111110111100100011001110010010111000100100111110011010110011101010001110010010111010100011101110011110111101100100011110011110111011100111001110010110101110100010011110010110000101101010001110100110011000101100101110010110111110101000010000101001101000011101000111010001110000011100110011101000101111001011110110001001101100011011110110011100101110011000110111001101100100011011100010111001101110011001010111010000101111011010100110000101110110011000010110101001101001011000010111011101100101011010010010111101100011011000010111010001100101011001110110111101110010011110010101111100110001001100100011011100110010001101000011011100110101001101110010111001101000011101000110110101101100
我的提示Prompt是decode the binary to string:,结果如下:
可以看到针对其中的英文部分,ChatGPT/AI可以直接给出答案,但是其中的中文编码,显示的是乱码。因此在理解中文编码这块ChatGPT/AI还不够智能,需要继续提示。但是继续提示的效率就不如使用其他工具来的高效了。ChatGPT/AI的好处之一就是在已分析部分给出了Python的代码,可以作为一个参考。
Octal
将下列的数字转换成为对应的ASCII字符串:
103 123 104 116 346 235 221 344 270 255 345 260 221 345 271 264 347 232 204 345 215 232 345 256 242 357 274 214 344 270 223 346 263 250 344 272 216 347 275 221 347 273 234 345 256 211 345 205 250 351 230 262 345 276 241 12 150 164 164 160 163 72 57 57 142 154 157 147 56 143 163 144 156 56 156 145 164 57 152 141 166 141 152 151 141 167 145 151 57 143 141 164 145 147 157 162 171 137 61 62 67 62 64 67 65 67 56 150 164 155 154
这块的难点在于并不知道这些数字是何种进制,究竟是十六进制,十进制还是八进制呢,通过数字的分布来看,所有的位置数字都不超过8,因此从概率上讲判断为8进制,但是并不清楚chatgpt能否总结出这样的规律性信息,询问ChatGPT,如下:
显然Chatgpt并没先判断出其是否是8进制,因此转换的全是乱码。更改提示词,再次询问ChatGPT,如下:
在获知其是8进制之后,发现能够解释英文部分,仍然无法解释中文部分。
hexdump
将hexdump格式数据转换成对应的字符格式:
00000000 43 53 44 4e e6 9d 91 e4 b8 ad e5 b0 91 e5 b9 b4 |CSDNæ..ä¸.å°.å¹´|
00000010 e7 9a 84 e5 8d 9a e5 ae a2 ef bc 8c e4 b8 93 e6 |ç..å..客ï¼.ä¸.æ|
00000020 b3 a8 e4 ba 8e e7 bd 91 e7 bb 9c e5 ae 89 e5 85 |³¨äº.ç½.ç».å®.å.|
00000030 a8 e9 98 b2 e5 be a1 0a 68 74 74 70 73 3a 2f 2f |¨é.²å¾¡.https://|
00000040 62 6c 6f 67 2e 63 73 64 6e 2e 6e 65 74 2f 6a 61 |blog.csdn.net/ja|
00000050 76 61 6a 69 61 77 65 69 2f 63 61 74 65 67 6f 72 |vajiawei/categor|
00000060 79 5f 31 32 37 32 34 37 35 37 2e 68 74 6d 6c |y_12724757.html|
ChatGPT/AI 的回答如下:
仍然是中文的部分解析不成功。
Base系列
解码Base系列编码格式数据:
INJUITXGTWI6JOFN4WYJDZNZWTTZVBHFRWNOLLVC566IZZFYSPTLHKHEXKHOPPMR465ZZZNORHSYLKHJTCZOLPVBBJUHI5DQOM5C6L3CNRXWOLTDONSG4LTOMV2C62TBOZQWU2LBO5SWSL3DMF2GKZ3POJ4V6MJSG4ZDINZVG4XGQ5DNNQ======
这块的难点是Base32的字符集是Base64字符集的子集,因此比较难以区分是Base32编码还是Base64编码或者其他base系列的编码。ChatGPT/AI 的回答如下:
看来ChatGPT/AI仍然改不了胡说八道的毛病,值得注意的是ChatGPT/AI成功的判断出了编码是Base32的编码,这块其应该内部对于字符串的出现频率进行了统计,但是没哟进一步的进行Base32解码很奇怪,所以ChatGPT/AI的行为总是令人难以捉摸。
URL编码
解码URL编码格式数据:
CSDN%E6%9D%91%E4%B8%AD%E5%B0%91%E5%B9%B4%E7%9A%84%E5%8D%9A%E5%AE%A2%EF%BC%8C%E4%B8%93%E6%B3%A8%E4%BA%8E%E7%BD%91%E7%BB%9C%E5%AE%89%E5%85%A8%E9%98%B2%E5%BE%A1%0Ahttps://blog.csdn.net/javajiawei/category_12724757.html
ChatGPT/AI 的回答如下:
给出了明确UTL解码的提示,中文也能能够成功的解码。
HTML编码
解码HTML编码格式数据:
CSDN村中少年的博客,专注于网络安全防御
https://blog.csdn.net/javajiawei/category_12724757.html
ChatGPT/AI 的回答如下:
这一点是ChatGPT/AI 比较麻烦和经常犯毛病的地方,因为整体看起来解析是对的,但是其中ChatGPT/AI 篡改了一些内容。原文是CSDN村中少年的博客,被ChatGPT/AI 篡改为CSDN汉字化的博客。因此对于ChatGPT/AI 的回答的结果,更多的是作为一个参考和提示,不能够全信,因为其往往在一些地方设置了坑。
Punnycode
解码Punnycode编码格式数据:
CSDN-ec5fkf40aq6p81ewxz1hao1c78qumef31bm1t0k1bxn5ar2b781s8euw
ChatGPT/AI 的回答如下:
又是一个一问三不知。
Unicode
解码Unicode编码格式数据:
CSDN\u6751\u4E2D\u5C11\u5E74\u7684\u535A\u5BA2\uFF0C\u4E13\u6CE8\u4E8E\u7F51\u7EDC\u5B89\u5168\u9632\u5FA1
ChatGPT/AI 的回答如下:
这块Unicode部分解码成功,但是没想到,我的博客的英文翻译竟然是Middle school boy,笑煞我也。
盲文
解码盲文:
⠓⠞⠞⠏⠎⠱⠌⠌⠃⠇⠕⠛⠨⠉⠎⠙⠝⠨⠝⠑⠞⠌⠚⠁⠧⠁⠚⠊⠁⠺⠑⠊⠌⠉⠁⠞⠑⠛⠕⠗⠽⠸⠂⠆⠶⠆⠲⠶⠢⠶⠨⠓⠞⠍⠇
ChatGPT/AI 的回答如下:
虽然Chatgpt判断出了其是盲文,但是仍然改不了其胡编乱邹的本领,这个难整啊。
总结
综上所述,总结如下:
- ChatGPT/AI 的回答在一些方面具备参考意义 ,可以作为一些线索提示。
- ChatGPT/AI其深度的判断能力不够,必须指定告诉其编码方式,才能提升解码成功的概率。
- ChatGPT/AI 存在胡说八道,以及篡改数据原本内容的行为,应该加以注意。
关于在网络安全运营中,如何的精确的处理述的数据格式转换问题,详见我的专栏《Cyberchef 从入门到精通教程》,这里。
本文为CSDN村中少年原创文章,未经允许不得转载,博主链接这里。