01.深入理解乱码的原理

本文通过实例深入解析乱码的原理,以一段网络上的乱码为例,进行逆向分析。从二进制到Unicode,揭示乱码背后的真实字符——拉丁小写字母e。通过实验验证,展示了从UTF-8编码到Unicode编号的转换过程。
摘要由CSDN通过智能技术生成

1. 前言

专栏介绍
本篇文章是此专栏的第一篇文章,在这之前,请允许我介绍一下本专栏:
你是否在学习过程中遇见了不认识的名词一脸懵逼?
你是否因为计算机的基础知识不合格陷入了学不会的死循环?
你是否在老师讲课的时候被抛出来的一系列名词不知所措?
本专栏就是为了解决这方面的问题
本专栏一周保持一篇左右的更新
喜欢的点点关注 非常感谢

2.什么是乱码

  • 这里不放任何的定义和理论,只用最简单的话来讲
  • 乱码就是你所遇到的"锟斤拷烫烫烫"和一些很奇怪的字符,它们就是乱码

3.逆向分析

我们在因特网上随便复制一段乱码,将它保存为UTF-8格式,使用VS编辑器打开.

3.1 开始分析

在这里插入图片描述

  • 现在展现给我们的是一段乱码,我们开始对这段乱码进行逆向分析
  • 我们要找到这些特殊字符是什么

3.2 二进制分析

  • 要想知道一段乱码的默认格式是什么,我们先从二进制开始分析
  • 使用Visual Studio二进制方式进行打开
  • 如图,出现的都是二进制数字,以十六进制进行展示.
    在这里插入图片描述
  • 我们可以看到很多CD 和CC开头的数据
  • 结合UTF-8编码知识
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值