返回首頁
另參考:

中日韓統一表意文字(U+4E00–U+9FFF)

簡介

「中日韓統一表意文字(CJK Unified Ideographs)」區塊位於U+4E00–U+9FFF範圍內,共佔據20,992個編碼空間,但實際上只編定了20,976個字符,由U+9FF0至U+9FFF間共十六個位置並沒有編排字符。

本區塊是最先在統一碼裏出現的表意文字區塊,最初在統一碼1.1版加入時,只有20,902個字符。文字按著部首和筆畫數順序排列(有小量的字因收編時的失誤,被放置到錯誤的部首之下),從U+4E00開始排列到U+9FA5為止,主要是我們最常用的漢字和少量吏讀字,包括了繁體字、中國大陸簡化字和日本新字形、簡體字、日本漢字等,並包含了常見的異體字。另外本區塊因「字源分離原則」而包含了一些形近義同本應合併的文字。

後來因為統一碼遲遲未推出擴充C區塊,於是硬把一些急於新增的漢字附到原有文字之後。以後也因為出現一些急用的現代用字,趕不及或不宜加到「補充表意文字平面」,而斷斷續續地加進本區塊中。從統一碼4.1版至今,在原有字集之後合共加上了74個字。

統一碼4.1版時,在U+9FA6至U+9FBB間新增了14個香港增補字符集的用字和8個GB 18030用字(主要用作漢字部件),共22個字。

統一碼5.1版時,在U+9FBC至U+9FC3間新增了7個由日本Adobe公司遞交的日語漢字及1個由魏安(Andrew West)和井作恆(John H. Jenkins)申請追加的字,共8個;之後的統一碼5.2版,大概認為再有8個字屬於常用表意字,所以把它們附進本區文字的後面,它們分別是2個日語用漢字(U+9FC4–U+9FC5)、1個新增漢字(U+9FC6)和在香港增補字符集二零零四(HKSCS-2004)推出後新增的5個香港漢字(U+9FC7–U+9FCB)。

後來的統一碼6.1版,新增了1個日語「涼」的異體字「鿌」(U+9FCC)。

到統一碼8.0版時,新增了9個漢字:3個(U+9FCD–U+9FCF)從《通用規範漢字表》裏選取,1個(U+9FD0)從「䲤」(U+4CA4)字分離出來,5個(U+9FD1–U+9FD5)由魏安提交的異體字和現代科學用字。

統一碼10.0版時,一口氣新增了21個漢字:20個(U+9FD6–U+9FE9)由加州大學柏克萊分校語言學系文字編碼提案計劃(Script Encoding Initiative, Berkeley Linguistics – UC Berkeley, SEI)提議新增,為翻譯俄羅斯東正教聖經的漢字——用作轉寫教會斯拉夫語的漢字;1個(U+9FEA)從「㸂」(U+3E02)字分離出來「燧」的異體字。

統一碼11.0版時,新增了5個漢字:3個(U+9FEB–U+9FED)屬新元素的中文名稱,2個(U+9FEE–U+9FEF)由日本提出的急用漢字(來歷不明)。

本區塊的字像其他表意文字區塊中的字般,都沒有專有名稱,只以編號稱呼為「CJK Ideograph-xxxx」。

有關表意文字的詳細說明,請參考拙文「統一碼裏中日韓表意文字和相關字符淺說」的介紹。

中日韓統一表意文字區塊字符表
 0123456789ABCDEF
 0123456789ABCDEF
4E0
4E1
4E2
4E3丿
4E4
4E5
4E6
4E7乿
4E8
4E9
4EA
4EB亿
4EC
4ED
4EE
4EF仿
4F0
4F1
4F2
4F3伿
4F4
4F5
4F6
4F7使
4F8
4F9
4FA
4FB便
4FC
4FD
4FE
4FF俿
500倀
501
502
503
504
505
506
507
508
509
50A
50B
50C
50D
50E
50F
510
511
512
513
514
515
516
517
518
519
51A
51B
51C
51D
51E
51F
520
521
522
523
524
525
526
527
528
529
52A
52B
52C
52D
52E
52F
530
531
532
533
534
535
536
537
538
539
53A
53B
53C
53D
53E
53F
540
541
542
543
544
545
546
547
548
549
54A
54B
54C
54D
54E
54F
550
551
552
553
554
555
556
557
558
559
55A
55B
55C
55D
55E
55F
560
561
562
563
564
565
566
567
568
569
56A
56B
56C
56D
56E
56F
570
571
572
573
574
575
576
577
578
579
57A
57B
57C
57D
57E
57F
580
581
582
583
584
585
586
587
588
589
58A
58B
58C
58D
58E
58F
590
591
592
593夿
594
595
596
597奿
598
599
59A
59B妿
59C
59D
59E
59F姿
5A0
5A1
5A2
5A3娿
5A4
5A5
5A6
5A7婿
5A8
5A9
5AA
5AB媿
5AC
5AD
5AE
5AF嫿
5B0
5B1
5B2
5B3嬿
5B4
5B5
5B6
5B7孿
5B8
5B9
5BA
5BB宿
5BC
5BD
5BE
5BF寿
5C0
5C1
5C2
5C3尿
5C4
5C5
5C6
5C7屿
5C8
5C9
5CA
5CB岿
5CC
5CD
5CE
5CF峿
5D0
5D1
5D2
5D3崿
5D4
5D5
5D6
5D7嵿
5D8
5D9
5DA
5DB嶿
5DC
5DD
5DE
5DF巿
5E0
5E1
5E2
5E3帿
5E4
5E5
5E6
5E7广
5E8
5E9
5EA
5EB庿
5EC
5ED
5EE
5EF廿
5F0
5F1
5F2
5F3弿
5F4
5F5
5F6
5F7彿
5F8
5F9
5FA
5FB徿
5FC
5FD
5FE
5FF忿
600怀
601
602
603
604
605
606
607
608
609
60A
60B
60C
60D
60E
60F
610
611
612
613
614
615
616
617
618
619
61A
61B
61C
61D
61E
61F
620
621
622
623
624
625
626
627
628
629
62A
62B
62C
62D
62E
62F
630
631
632
633
634
635
636
637
638
639
63A
63B
63C
63D
63E
63F
640
641
642
643
644
645
646
647
648
649
64A
64B
64C
64D
64E
64F
650
651
652
653
654
655
656
657
658
659
65A
65B
65C
65D
65E
65F
660
661
662
663
664
665
666
667
668
669
66A
66B
66C
66D
66E
66F
670
671
672
673
674
675
676
677
678
679
67A
67B
67C
67D
67E
67F
680
681
682
683
684
685
686
687
688
689
68A
68B
68C
68D
68E
68F
690
691
692
693椿
694
695
696
697楿
698
699
69A
69B榿
69C
69D
69E
69F槿
6A0
6A1
6A2
6A3樿
6A4
6A5
6A6
6A7橿
6A8
6A9
6AA
6AB檿
6AC
6AD
6AE
6AF櫿
6B0
6B1
6B2
6B3欿
6B4
6B5
6B6
6B7歿
6B8
6B9
6BA
6BB殿
6BC
6BD
6BE
6BF毿
6C0
6C1
6C2
6C3氿
6C4
6C5
6C6
6C7汿
6C8
6C9
6CA
6CB沿
6CC
6CD
6CE
6CF泿
6D0
6D1
6D2
6D3洿
6D4
6D5
6D6
6D7浿
6D8
6D9
6DA
6DB涿
6DC
6DD
6DE
6DF淿
6E0
6E1
6E2
6E3渿
6E4
6E5
6E6
6E7湿
6E8
6E9
6EA
6EB溿
6EC
6ED
6EE
6EF滿
6F0
6F1
6F2
6F3漿
6F4
6F5
6F6
6F7潿
6F8
6F9
6FA
6FB澿
6FC
6FD
6FE
6FF濿
700瀀
701
702
703
704
705
706
707
708
709
70A
70B
70C
70D
70E
70F
710
711
712
713
714
715
716
717
718
719
71A
71B
71C
71D
71E
71F
720
721
722
723
724
725
726
727
728
729
72A
72B
72C
72D
72E
72F
730
731
732
733
734
735
736
737
738
739
73A
73B
73C
73D
73E
73F
740
741
742
743
744
745
746
747
748
749
74A
74B
74C
74D
74E
74F
750
751
752
753
754
755
756
757
758
759
75A
75B
75C
75D
75E
75F
760
761
762
763
764
765
766
767
768
769
76A
76B
76C
76D
76E
76F
770
771
772
773
774
775
776
777
778
779
77A
77B
77C
77D
77E
77F
780
781
782
783
784
785
786
787
788
789
78A
78B
78C
78D
78E
78F
790
791
792
793礿
794
795
796
797祿
798
799
79A
79B禿
79C
79D
79E
79F秿
7A0
7A1
7A2
7A3稿
7A4
7A5
7A6
7A7穿
7A8
7A9
7AA
7AB窿
7AC
7AD
7AE
7AF竿
7B0
7B1
7B2
7B3笿
7B4
7B5
7B6
7B7筿
7B8
7B9
7BA
7BB箿
7BC
7BD
7BE
7BF篿
7C0
7C1
7C2
7C3簿
7C4
7C5
7C6
7C7籿
7C8
7C9
7CA
7CB粿
7CC
7CD
7CE
7CF糿
7D0
7D1
7D2
7D3紿
7D4
7D5
7D6
7D7絿
7D8
7D9
7DA
7DB綿
7DC
7DD
7DE
7DF緿
7E0
7E1
7E2
7E3縿
7E4
7E5
7E6
7E7繿
7E8
7E9
7EA
7EB线
7EC
7ED
7EE
7EF绿
7F0
7F1
7F2
7F3缿
7F4
7F5
7F6
7F7罿
7F8
7F9
7FA
7FB羿
7FC
7FD
7FE
7FF翿
800耀
801
802
803
804
805
806
807
808
809
80A
80B
80C
80D
80E
80F
810
811
812
813
814
815
816
817
818
819
81A
81B
81C
81D
81E
81F
820
821
822
823
824
825
826
827
828
829
82A
82B
82C
82D
82E
82F
830
831
832
833
834
835
836
837
838
839
83A
83B
83C
83D
83E
83F
840
841
842
843
844
845
846
847
848
849
84A
84B
84C
84D
84E
84F
850
851
852
853
854
855
856
857
858
859
85A
85B
85C
85D
85E
85F
860
861
862
863
864
865
866
867
868
869
86A
86B
86C
86D
86E
86F
870
871
872
873
874
875
876
877
878
879
87A
87B
87C
87D
87E
87F
880
881
882
883
884
885
886
887
888
889
88A
88B
88C
88D
88E
88F
890
891
892
893褿
894
895
896
897西
898
899
89A
89B覿
89C
89D
89E
89F觿
8A0
8A1
8A2
8A3訿
8A4
8A5
8A6
8A7詿
8A8
8A9
8AA
8AB調
8AC
8AD
8AE
8AF諿
8B0
8B1
8B2
8B3謿
8B4
8B5
8B6
8B7譿
8B8
8B9
8BA
8BB访
8BC
8BD
8BE
8BF诿
8C0
8C1
8C2
8C3谿
8C4
8C5
8C6
8C7豿
8C8
8C9
8CA
8CB貿
8CC
8CD
8CE
8CF賿
8D0
8D1
8D2
8D3贿
8D4
8D5
8D6
8D7赿
8D8
8D9
8DA
8DB趿
8DC
8DD
8DE
8DF跿
8E0
8E1
8E2
8E3踿
8E4
8E5
8E6
8E7蹿
8E8
8E9
8EA
8EB躿
8EC
8ED
8EE
8EF軿
8F0
8F1
8F2
8F3輿
8F4
8F5
8F6
8F7轿
8F8
8F9
8FA
8FB辿
8FC
8FD
8FE
8FF迿
900退
901
902
903
904
905
906
907
908
909
90A
90B
90C
90D
90E
90F
910
911
912
913
914
915
916
917
918
919
91A
91B
91C
91D
91E
91F
920
921
922
923
924
925
926
927
928
929
92A
92B
92C
92D
92E
92F
930
931
932
933
934
935
936
937
938
939
93A
93B
93C
93D
93E
93F
940
941
942
943
944
945
946
947
948
949
94A
94B
94C
94D
94E
94F
950
951
952
953
954
955
956
957
958
959
95A
95B
95C
95D
95E
95F
960
961
962
963
964
965
966
967
968
969
96A
96B
96C
96D
96E
96F
970
971
972
973
974
975
976
977
978
979
97A
97B
97C
97D
97E
97F
980
981
982
983
984
985
986
987
988
989
98A
98B
98C
98D
98E
98F
990
991
992
993餿
994
995
996
997饿
998
999
99A
99B馿
99C
99D
99E
99F駿
9A0
9A1
9A2
9A3騿
9A4
9A5
9A6
9A7驿
9A8
9A9
9AA
9AB骿
9AC
9AD
9AE
9AF髿
9B0
9B1
9B2
9B3鬿
9B4
9B5
9B6
9B7魿
9B8
9B9
9BA
9BB鮿
9BC
9BD
9BE
9BF鯿
9C0
9C1
9C2
9C3鰿
9C4
9C5
9C6
9C7鱿
9C8
9C9
9CA
9CB鲿
9CC
9CD
9CE
9CF鳿
9D0
9D1
9D2
9D3鴿
9D4
9D5
9D6
9D7鵿
9D8
9D9
9DA
9DB鶿
9DC
9DD
9DE
9DF鷿
9E0
9E1
9E2
9E3鸿
9E4
9E5
9E6
9E7鹿
9E8
9E9
9EA
9EB麿
9EC
9ED
9EE
9EF黿
9F0
9F1
9F2
9F3鼿
9F4
9F5
9F6
9F7齿
9F8
9F9
9FA
9FB龿
9FC
9FD
9FE
9FF

字符說明

4E00–9FA5
最初公佈的中日韓表意文字。按照《康熙字典》的字序來排列,由第一個的「一」字起,至最後的「龥」字為止,合共20,902個字符。
9FA6–9FB3:龦龧龨龩龪龫龬龭龮龯龰龱龲龳
統一碼4.1版新增的14個「香港字」,它們不是按部首排序,而是按照它們在香港增補字符集中的內碼(大五碼)排列,看來像胡亂編在一起。
9FB4–9FBB:龴龵龶龷龸龹龺龻
統一碼4.1版新增的8個GB 18030用字,可是它們其實並不是文字,而是內地印刷業常用的偏旁和字形部件;它們也不是按部首排列,而是按照GB 18030的內碼排列,不過幸好是依照畫數和筆順來排序。
9FBC–9FC2:龼龽龾龿鿀鿁鿂
統一碼5.1版新增的7個由日本Adobe公司遞交的日語漢字,它們全部按照部首排序。
9FC3:鿃
統一碼5.1版新增的1個由魏安(Andrew West)和井作恆(John H. Jenkins)申請追加的字,它是「目」旁加「㚒」(⿰目㚒),和「目」旁加「夾」的「䀹」(⿰目夾,U+4039)不同。
9FC4–9FC6:鿄鿅鿆
統一碼5.2版新增的3個漢字,但似乎是一些字的異體字。
9FC7–9FCB:鿇鿈鿉鿊鿋
統一碼5.2版新增的5個「香港字」,它們是香港增補字符集二零零四(HKSCS-2004)推出後新收錄的字,全部按照部首排序。
9FCC:鿌
統一碼6.1版新增的1個異體字。
9FCD–9FCF:鿍鿎鿏
統一碼8.0版新增的3個漢字,屬於出現在《通用規範漢字表》中,而未包含在統一碼規格中的漢字。
9FD0:鿐
統一碼8.0版新增的1個漢字,本字原來和簡化字「䲤」(U+4CA4)統合在一起,現在把兩字分離,其中的繁體形式放到U+9FD0。
9FD1–9FD5:鿑鿒鿓鿔鿕
統一碼8.0版新增的5個漢字。「鿑」為「珏」的異體字;其他四個為化學元素及生物用字和它的類推繁體字。原本屬於由魏安(Andrew West)提出的226個二簡字(《第二次漢字簡化方案(草案)》,於一九八六年六月廿四日經國務院發出通知而廢除)、類推簡化字、錯訛字、梵語音譯字和現代科學用字等,當時他本人建議把全部的字都加到中日韓統一表意文字擴充F區塊裏去,現把這5個急用的現代用字改為加進中日韓統一表意文字區塊中。
9FD6–9FE9:鿖鿗鿘鿙鿚鿛鿜鿝鿞鿟鿠鿡鿢鿣鿤鿥鿦鿧鿨鿩
統一碼10.0版新增的20個轉寫教會斯拉夫語用的漢字,由加州大學柏克萊分校語言學系文字編碼提案計劃(SEI)提議新增,只用於翻譯俄羅斯東正教聖經中人名和地名的音譯字。除了鿖(U+9FD6)和鿗(U+9FD7)以外,其餘全是由兩個漢字合成,以傳統的反切法來造字,右取聲母左韻母,合成一個可以表達一個斯拉夫語音節的字。原本提議放到中日韓統一表意文字擴充F區塊中,但最後卻改放到中日韓統一表意文字區塊裏。
鿖:「耶穌•基督」中「基督」(Христос)[xrʲɪˈstos]的縮寫,全寫為「合鿠斯托斯」。
鿗:「耶穌•基督」中「耶穌」(Иисус)[ɪɪˈsus]的縮寫,全寫為「伊伊穌斯」。
鿘:用作音譯教會斯拉夫語音節хи /xi/,如「羋利鿘乙」(Мелхий)。
鿙:用作音譯教會斯拉夫語音節ки /ki/,如「耶捷鿙亞」(Езекия)。
鿚:用作音譯教會斯拉夫語音節ги /ɡi/,如「些爾鿚乙」(Сергий)。
鿛:用作音譯教會斯拉夫語音節рин /rin/,如「适鿛福」(Коринф)。
鿜:用作音譯教會斯拉夫語音節ра /ra/,如「伊斯鿜伊利」(Израиль)。
鿝:用作音譯教會斯拉夫語音節рен /ren/,如「鐵鿝提乙」(Терентий)。
鿞:用作音譯教會斯拉夫語音節ре /re/,如「那匝鿞特」(Назарет)。
鿟:「鿠」的簡體形式,和「鿠」的用途相等。
鿠:用作音譯教會斯拉夫語音節ри /ri/,如「合鿠斯托斯」(Христос);在日文的翻譯本中,也可以表示以l音結尾
鿡:用作音譯教會斯拉夫語音節ро /ro/,如「鿡瑪」(романский)。
鿢:用作音譯教會斯拉夫語音節хе /xe/,如「西鿢木」(Сихем)。
鿣:用作音譯教會斯拉夫語音節ке /ke/,如「鿣薩鿠亞」(Кесария)。
鿤:用作音譯教會斯拉夫語音節ге /ɡe/,如「尼鿤爾」(Нигер)。
鿥:用作音譯教會斯拉夫語音節ран /ran/,如「哈爾鿥」(Аран)。
鿦:用作音譯教會斯拉夫語音節вин /vin/,如「那鿦」(Навин)。
鿧:用作音譯教會斯拉夫語音節рон /ron/,如「阿阿鿧」(Аарон)。
鿨:用作音譯教會斯拉夫語音節рея /reia/,如「那作鿨」(назареянин)。
鿩:用作音譯教會斯拉夫語音節ру/ru/,如「耶鿩薩利木」(Иерусалим)。本字應作右爾左魯,原本遞交的申請文件和統一碼文件有誤。
9FEA:鿪
統一碼10.0版新增的1個漢字,本字原來和「火」字底的「㸂」(U+3E02)統合在一起,現在把兩字分離,其中「灬」字底的形式放到U+9FEA。
9FEB–9FED:鿫鿬鿭
統一碼11.0版新增的3個急用漢字,為三種新化學元素的名稱:第117號元素「鿫」和第118號元素「鿬」,而「鿭」則為第113號元素「鉨」的類推簡化字。
9FEE–9FEF:鿮鿯
統一碼11.0版新增的2個急用漢字,由日本提出。