Unicode 与 UTF-8 Unicode Unicode 是一种统一码,统一了世界上各种文字编码.这里我可以简单的把 Unicode 理解为一张表,表里为数字对应的文字. 10 进制 16 进制 字符 77 0x004D M 78 0x004E N … … … 19969 0x4E01 丁 36229 0x8D85 超 … … … UTF-8 UTF-8 就是 Unicode 的一种实现方式,UTF-8 最长是四个字节,为什么说最长,因为它是变长的,比如我们要表达字符 A 就使用一个字节就可以了,如果我们要表达丁就需要三个字节.从这点看来 UTF-8 是利于传输的,把 UTF-8 编码变为字符只需要把 UTF-8 按照一定规则转换为 Unicode 码即可找出对应的字符.……

阅读全文