背景
java 的字符串会设计很多编码相关的问题,全部整理一下
知识点
Code Unit
code unit 描述的是一个编码的的最小单位(注意一个Unicode 平面对应的字符可能由多个code unit 组成)
编码 | unit code |
---|---|
utf-8 | 1字节 |
utf-16 | 2字节 |
java 的char
java 的char 是2个字节,类型的范围是 0 到 2^16 - 1.
java 的字符串会设计很多编码相关的问题,全部整理一下
code unit 描述的是一个编码的的最小单位(注意一个Unicode 平面对应的字符可能由多个code unit 组成)
编码 | unit code |
---|---|
utf-8 | 1字节 |
utf-16 | 2字节 |
java 的char 是2个字节,类型的范围是 0 到 2^16 - 1.