GB2312 转化为 UTF-8 中文乱码

最新推荐文章于 2025-05-12 18:34:46 发布

lizhihaoweiwei

最新推荐文章于 2025-05-12 18:34:46 发布

阅读量8.6k

点赞数 1

分类专栏： Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lizhihaoweiwei/article/details/27332309

版权

Java 专栏收录该内容

45 篇文章

订阅专栏

爬虫项目中，有网页是使用 gb2312 编码的，在将网页内容转化为 UTF-8 后发现有些中文乱码了，经过对比得知，这些乱码实际上是繁体中文。

gb2312 只能表示简体中文。如果将 gb2312 的字体串转化为 UTF-8 的字符串，繁体中文是会乱码的。解决方案是先将 gb2312 转化为 GBK 编码，再转化为 UTF-8 编码。

GBK 是 gb2312 的超集，它兼容 gb2312 编码，同时还包括繁体中文编码。

博客等级

码龄14年

189
原创

42
点赞

159
收藏

42
粉丝

关注

私信

热门文章

分类专栏

C/C++ 40篇
linux 3篇
CUDA 1篇
Windows 5篇
实践，项目 2篇
算法 38篇
UNIX编程 4篇
数据库 4篇
服务器 4篇
搜索引擎 8篇
数学 4篇
编程语言原理 1篇
Java 45篇
项目管理 1篇
计算机网络 4篇
排列组合 2篇
前端 4篇
实践 8篇
项目 4篇
并发编程 7篇
Java-IO 7篇
大数据

展开全部收起

上一篇：: Visual svn 自动更新勾子问题

下一篇：: 一个较难的数据库查询(后来在解决的过程中发现有简单解法)

最新评论

破解可读不可复制的 U 盘
2401_83797255: 您好，可以请教一些关于这个思路的一些问题吗
使用 jdMind 及改进
yyn_1111: 您好，在哪里可以拿到修改好的jsmind库以及使用方法，非常需要，谢谢您
数据库加字段不支持灰度发布和回滚的情况
yaliuhen: 实际的应用中，比你这情况更复杂。表结构怎删改抵押有可能，insert A() values () 删字段就不适用了
cpu 乱序执行与问题
QMCoder: 还有一点需要保证：b==1 时必然已经 a==1。这就要求CPU0上的 a==1 的执行效果先于 b==1 上完成。也就是，先写入 a==1，再写入 b==1。有个疑问， cpu0 a=1 写入了store buffer，然后b写入了cache line 对于cpu0而言，他现在的状态就是 a=1 b=1, 那么cpu1需要读a的时候，请求cpu0，获取到的不是a=1吗，那这样为啥需要sfence让cpu0刷新a到cacheline呢
Git 设置网络代理
杨Jack: 问题是第一次git clone github上的代码怎么办？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。