unicode编码能表示多少汉字 unicode编码( 二 )


很多传统的编码方式都有一个共同的问题,即容许电脑处理双语环境(通常使用拉丁字母以及其本地语言),但却无法同时支持多语言环境(指可同时处理多种语言混合的情况) 。
扩展资料:
Unicode 兼容于 ASCII 字符并被大多数程序所支持,前128个 Unicode 码同 ASCII 码具有同样的字节值;Unicode 字符从 U+0020 到 U+007E 等同与 ASCII 码的 0x20 到 0x7E,不同于支持拉丁字母的7位 ASCII 。
Unicode 对每个字符进行16位值的编码设置,它允许几万个字符,例如 Unicode 2.0 版包含 38,885 个字符,它也可以进行扩展,如 UTF-16 允许用16位字符组合为一百万或更多的字符,UTF 将编码转换为真实的二进制位 。
Unicode 完全兼容于国际标准 ISO/IEC 10646-1; 1993,它是 ISO 10646 的一个子集,并支持用两个八进制数的 ISO UCS-2(Universal Character Set) 。
JavaScript 1.3 版本对 Unicode 的支持意味着您可以任意地在程序中使用本地的字符以及特殊的科学符号 。Unicode 提供了一种标准的方法来编码多语言文本,并且因为它兼容于 ASCII ,您也可以随意使用 ASCII 字符 。
参考资料来源:百度百科-Unicode
常用Unicode编码unicode编码范围:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
【unicode编码能表示多少汉字 unicode编码】小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
汉字编码范围:\u4E00-\u9FA5
双字节字符编码范围:\u0391-\uFFE5
双字节字符编码范围
汉字unicode编码表
一般使用2w基本汉字就够了
|字符集|字数|Unicode 编码|
|基本汉字| 20902字 | 4E00-9FA5 |
|基本汉字补充| 38字 | 9FA6-9FCB |
|扩展A| 6582字 | 3400-4DB5 |
|扩展B| 42711字 | 20000-2A6D6 |
|扩展C| 4149字 | 2A700-2B734 |
|扩展D| 222字 | 2B740-2B81D |
|康熙部首| 214字 | 2F00-2FD5 |
|部首扩展| 115字 | 2E80-2EF3 |
|兼容汉字| 477字 | F900-FAD9 |
|兼容扩展| 542字 | 2F800-2FA1D |
|PUA(GBK)部件| 81字 | E815-E86F |
|部件扩展| 452字 | E400-E5E8 |
|PUA增补| 207字 | E600-E6CF |
|汉字笔画| 36字 | 31C0-31E3 |
|汉字结构| 12字 | 2FF0-2FFB |
|汉语注音| 22字 | 3105-3120 |
|注音扩展| 22字 | 31A0-31BA |
| 〇 | 1字 | 3007 |

unicode编码能表示多少汉字 unicode编码

文章插图

秒懂生活扩展阅读