GBK 在 unicode 编码中,字符的收录分布情况
1:所有的 GBK 字符在 unicode 都有收录(都在 unicode 的 UCS-2 编码范围,也就是2字节的unicode能表示)2:大多数汉字都在 unicode 编码范围的 中日韩统一汉字 中(0x4E00-0x9FA5)
3:下表列出GBK在 unicode 中的分布详情(不列出 中日韩统一汉字)
Unicode字符集起始编码结束编码GBK字符数量列出此字符集中包含的GBK字符
中日韩统一汉字0x4E000x9FFF20902
用户自定义区0xE0000xF8FF1372
部件扩展0xE4000xE5E8489
PUA增补0xE6000xE6CF208
框线绘制符号0x25000x257F112═║╒╓╔╕╖╗╘╙╚╛╜╝╞╟╠╡╢╣╤╥╦╧╨╩╪╫╬╭╮╯╰╱╲╳─━│┃┄┅┆┇┈┉┊┋┌┍┎┏┐┑┒┓└┕┖┗┘┙┚┛├┝┞┟┠┡┢┣┤┥┦┧┨┩┪┫┬┭┮┯┰┱┲┳┴┵┶┷┸┹┺┻┼┽┾┿╀╁╂╃╄╅╆╇╈╉╊╋
半角片假名、谚文、拉丁字母0xFF000xFFEF100~$¢£!"#¥%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|} ̄¬¦
片假名0x30A00x30FF89ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶーヽヾ
平假名0x30400x309F87ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん゛゜ゝゞ
PUA(GBK)部件0xE8150xE86F80
西里尔字符0x04000x04FF66АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя
带圈字母和数字0x24600x24FF50⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③④⑤⑥⑦⑧⑨⑩
希腊文字中的科普特字符0x03700x03FF48ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψω
汉语注音字母0x31000x312F37ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒㄓㄔㄕㄖㄗㄘㄙㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄤㄥㄦㄧㄨㄩ
数学运算符0x22000x22FF37∶∧∨∑∏∪∩∈∷√⊥∥∠⊙∫∮≡≌≈∽∝≠≮≯≤≥∞∵∴∕∟∣≒≦≧⊿⊕
中日韩标点符号0x30000x303F34、。〃々〔〕〈〉《》「」『』〖〗【】〓〒〝〞〡〢〣〤〥〦〧〨〩〆〇
CJK Compatibility Forms0xFE300xFE4F27︵︶︹︺︿﹀︽︾﹁﹂﹃﹄︻︼︷︸︱︳︴︰﹉﹊﹋﹌﹍﹎﹏
小形式变体字符0xFE500xFE6F25﹐﹑﹒﹔﹕﹖﹗﹙﹚﹛﹜﹝﹞﹟﹠﹡﹢﹣﹤﹥﹦﹨﹩﹪﹫
数字形式字符0x21500x218F22ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ
中日韩相容汉字0xF9000xFAFF21郎凉秊裏隣兀嗀﨎﨏﨑﨓﨔礼﨟蘒﨡﨣﨤﨧﨨﨩
增补拉丁字符集 10x00800x00FF20·¨±×÷°¤§áàéèíìóòúùüê
方形组块图符0x25800x259F18▁▂▃▄▅▆▇█▉▊▋▌▍▎▏▓▔▕
通用标点符号0x20000x206F16—‖…‘’“”′″‰※–―‥‵‐
几何图形0x25A00x25FF15○●◎◇◆□■△▲▼▽◢◣◤◥
带圈中日韩相容表音文字字母和月份符号0x32000x32FF12㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩㊣㈱
中日韩相容符号0x33000x33FF11㎎㎏㎜㎝㎞㎡㏄㏎㏑㏒㏕
箭头符号0x21900x21FF8→←↑↓↖↗↘↙
拉丁字符扩展集 A0x01000x017F8āēěīōūńň
拉丁字符扩展集 B0x01800x024F8ǎǐǒǔǖǘǚǜ
字母类符号0x21000x214F5℃№℅℉℡
间隔修饰符0x02B00x02FF5ˉˇˊˋ˙
综合符号0x26000x26FF5♂♀☆★☉
国际音标扩展集0x02500x02AF2ɑɡ
综合技术符号0x23000x23FF1⌒
页:
[1]