首先讲到编码格式,就先了解一下 编码 的概念

是信息从一种形式或格式转换为另一种形式的过程

我们都知道 计算机底层真正执行操作的是CPU的指令集,但是我们真正去操作硬件难度太高,我们Java进程在操作的时候,底层就是操作的CPU指令集,为什么Java还要我们写编码呢,直接写指令集不香么?不香,指令集是底层的东西,越低层,难度越高。机器能识别,我们人类不能识别,编写起来更加困难。就需要一个统一的编码格式,方便我们人类去操作。

我们说一下常见的编码

GBK 包含全部中文字符,

GB2315

UTF-8 则包含全世界所有国家需要用到的字符。

ISO8859-1

Unicode

占用字节情况

编码英文占用字节情况中文占用字节情况
GBK22
UTF-813