孟加拉文 (Unicode區段)

孟加拉文
Bengali
範圍U+0980..U+09FF
(128個碼位)
平面基本多文種平面BMP
文字孟加拉文
應用孟加拉語
阿薩姆語
比什努普里亚-曼尼普尔语
已分配96個碼位
未分配32個保留碼位
來源標準ISCII
統一碼版本歷史
1.0.089 (+89)
4.090 (+1)
4.191 (+1)
5.292 (+1)
7.093 (+1)
10.095 (+2)
11.096 (+1)
碼表
點擊此處
註釋[1][2]

孟加拉文是一個位於基本多文種平面的Unicode區塊,收錄了用於書寫孟加拉語阿薩姆語, 比什努普里亚-曼尼普尔语達夫拉語英语Dafla language加罗语卡西語米佐語蒙达里语那加語英语Naga languages桑塔利語特里普拉語英语Kokborok language孟加拉文字符。在最初的版本中,碼位U+0981..U+09CD是對1988年ISCII標準中孟加拉文字符A1-ED的直接複製,兩個阿薩姆語字符U+09F0與U+09F1亦在其中。另外,天城文,古木基文,古吉拉特文,卡納達文,馬拉雅拉姆文,奧里亞文,泰米爾文和泰盧固文等Unicode區塊也都是基于ISCII編碼的。

區塊

孟加拉文
Bengali[1][2]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+098x
U+099x
U+09Ax
U+09Bx ি
U+09Cx
U+09Dx
U+09Ex
U+09Fx
注釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未被分配的碼位

歷史

以下Unicode文檔記錄了與這一區塊相關的提案:

版本 最終碼位[a] 碼位数 UTC ID L2英语International Committee for Information Technology Standards ID WG2英语ISO/IEC JTC 1/SC 2 ID 文檔
1.0.0 U+0981..0983, 0985..098C, 098F..0990, 0993..09A8, 09AA..09B0, 09B2, 09B6..09B9, 09BC, 09BE..09C4, 09C7..09C8, 09CB..09CD, 09D7, 09DC..09DD, 09DF..09E3, 09E6..09FA 89 UTC/1991-056 Whistler, Ken, Indic Charts: Devanagari, Bengali, Gurmukhi, Gujarati, Oriya, Tamil, Telugu, Kannada, Malayalam 
UTC/1991-057 Whistler, Ken, Indic names list 
UTC/1991-048B Whistler, Ken, III. L. Walk In proposals, Draft Minutes from the UTC meeting #46 day 2, 3/27 at Apple, 1991-03-27 
L2/01-303 Vikas, Om, Letter from the Government from India on "Draft for Unicode Standard for Indian Scripts", 2001-07-26 
L2/01-304 Feedback on Unicode Standard 3.0, 2001-08-02 
L2/01-305 McGowan, Rick, Draft UTC Response to L2/01-304, "Feedback on Unicode Standard 3.0", 2001-08-08 
L2/01-430R McGowan, Rick, UTC Response to L2/01-304, "Feedback on Unicode Standard 3.0", 2001-11-20 
L2/03-113 Everson, Michael, Conjuncts: making sure we are right, 2003-03-05 
L2/08-288 Whistler, Ken, Public Review Issue #123: Bengali Currency Numerator Values, 2008-08-04 
L2/08-361 Moore, Lisa, Bengali Currency Numerator Values (B.11.1), UTC #117 Minutes, 2008-12-02 
L2/09-225R Moore, Lisa, E.1.2, UTC #120 / L2 #217 Minutes, 2009-08-17 
L2/20-055 Pournader, Roozbeh, Proposed sequences for composition exclusions, 2020-01-16 
L2/20-015 Moore, Lisa, B.13.1.1 Proposed sequences for composition exclusions, Draft Minutes of UTC Meeting 162, 2020-01-23 
4.0 U+09BD 1 L2/01-431R[b] McGowan, Rick, Actions for UTC and Editorial Committee in response to L2/01-430R, 2001-11-08 
L2/01-405R Moore, Lisa, Consensus 89-C19, Minutes from the UTC/L2 meeting in Mountain View, November 6-9, 2001, 2001-12-12, Accept the twelve Indic characters with names and coding positions as documented in L2/01-431R 
L2/02-117 N2425 (页面存档备份,存于互联网档案馆 McGowan, Rick, Additional Characters for Indic Scripts, 2002-03-21 
L2/03-084 Jain, Manoj, Proposed changes in the Unicode Standards for Indic Scripts - Bengali, 2003-03-03 
L2/03-102 Vikas, Om, Unicode Standard for Indic Scripts, 2003-03-04 
L2/03-101.1 Proposed Changes in Indic Scripts [Bengali document], 2003-03-04 
L2/03-104 Jain, Manoj, Sample Text for Bengali Sign Avagraha, 2003-03-04 
L2/04-102 Pavanaja, U. B., Bug in Kannada collation, 2004-02-10 
L2/04-432 Wissink, Cathy, Indic collation: action items 99-20 and 99-29, 2004-12-31 
4.1 U+09CE 1 L2/00-303 N2261 (页面存档备份,存于互联网档案馆 Incorporation of Bangla (Bengali) Coded Character in ISO/IEC 10646-1, 2000-08-23 
L2/00-304 N2261-1 Proposal Summary Form for character U+09BA, KHANDATA, 2000-08-23 
L2/01-050 N2253 (页面存档备份,存于互联网档案馆 Umamaheswaran, V. S., 7.12 Proposal to synchronize Bengali standard with 10646, Minutes of the SC2/WG2 meeting in Athens, September 2000, 2001-01-21 
L2/03-084 Jain, Manoj, Proposed changes in the Unicode Standards for Indic Scripts - Bengali, 2003-03-03 
L2/03-102 Vikas, Om, Unicode Standard for Indic Scripts, 2003-03-04 
L2/03-101.1 Proposed Changes in Indic Scripts [Bengali document], 2003-03-04 
L2/04-060 Sengupta, Gautam, Encoding Bangla Khanda-Ta With Ta+Virama, 2004-02-01 
L2/04-062 Constable, Peter, Encoding Bangla Khanda-Ta With Ta+Virama, 2004-02-01 
L2/04-102 Pavanaja, U. B., Bug in Kannada collation, 2004-02-10 
L2/04-262 N2810 (页面存档备份,存于互联网档案馆 Constable, Peter, Encoding of Bengali Khanda Ta in Unicode (PRI #30 document), 2004-02-17 
L2/04-192 N2811 (页面存档备份,存于互联网档案馆 Sengupta, Gautam, Feedback on PR-30: Encoding of Bangla Khanda Ta in Unicode, 2004-06-07 
L2/04-233 N2812 (页面存档备份,存于互联网档案馆 Vikas, Om, Letter to Mark Davis re Bengali Khanda Ta, 2004-06-10 
L2/04-252 N2813 (页面存档备份,存于互联网档案馆 Constable, Peter, Review of Bengali Khanda Ta and PRI-30 Feedback, 2004-06-15 
L2/04-264 N2809 (页面存档备份,存于互联网档案馆 Constable, Peter, Proposal to encode Bengali Khanda Ta in the UCS, 2004-06-17 
L2/04-432 Wissink, Cathy, Indic collation: action items 99-20 and 99-29, 2004-12-31 
5.2 U+09FB 1 N3353 (pdf, doc (页面存档备份,存于互联网档案馆)) Umamaheswaran, V. S., M51.18, Unconfirmed minutes of WG 2 meeting 51 Hanzhou, China; 2007-04-24/27, 2007-10-10 
L2/07-192 N3311 (页面存档备份,存于互联网档案馆 Pandey, Anshuman, Proposal to Encode the Ganda Currency Mark for Bengali in the BMP of the UCS, 2007-05-21 
L2/07-225 Moore, Lisa, Bengali, UTC #112 Minutes, 2007-08-21 
7.0 U+0980 1 L2/11-359 Pandey, Anshuman, Proposal to Encode the Sign Anji for Bengali, 2011-10-21 
L2/11-403 Anderson, Deborah; McGowan, Rick; Whistler, Ken, IV. BENGALI, Review of Indic-related L2 documents and Recommendations to the UTC, 2011-10-26 
L2/11-408 Lata, Swaran, Letter from Swaran Lata, Gov't of India, re proposals, 2011-10-27 
L2/12-079 Lata, Swaran, Inputs of Govt. of India on various documents, 2012-02-07 
L2/12-121 N4157 (页面存档备份,存于互联网档案馆 Pandey, Anshuman, Proposal to Encode the Sign ANJI for Bengali, 2012-04-23 
L2/12-147 Anderson, Deborah; McGowan, Rick; Whistler, Ken, VII. BENGALI, Review of Indic-related L2 documents and Recommendations to the UTC, 2012-04-25 
L2/12-184 Lata, Swaran, GOI Feedback on the various Indic related documents, 2012-05-07 
L2/12-277 Lata, Swaran, GOI Feedback on the various Indic related document submitted to UTC, 2012-07-26 
10.0 U+09FC 1 L2/15-204 Anderson, Deborah; et al, 3. Bengali, Recommendations to UTC #144 July 2015 on Script Proposals, 2015-07-25 
L2/15-161 Sharma, Shriramana, Proposal to encode 09CF BENGALI LETTER VEDIC ANUSVARA, 2015-07-31 
L2/15-187 Moore, Lisa, D.6.1, UTC #144 Minutes, 2015-08-11 
N4739 (页面存档备份,存于互联网档案馆 M64.06, Unconfirmed minutes of WG 2 meeting 64, 2016-08-31 
U+09FD 1 L2/15-172R A, Srinidhi; A, Sridatta, Proposal to Encode an Abbreviation Sign for Bengali, 2015-07-09 
L2/15-204 Anderson, Deborah; et al, 3. Bengali, Recommendations to UTC #144 July 2015 on Script Proposals, 2015-07-25 
L2/15-187 Moore, Lisa, D.6.2, UTC #144 Minutes, 2015-08-11 
N4739 (页面存档备份,存于互联网档案馆 M64.06, Unconfirmed minutes of WG 2 meeting 64, 2016-08-31 
11.0 U+09FE 1 L2/16-322 N4808 (页面存档备份,存于互联网档案馆 A, Srinidhi; A, Sridatta, Proposal to encode the SANDHI MARK for Bengali, 2016-11-01 
L2/17-037 Anderson, Deborah; Whistler, Ken; Pournader, Roozbeh; Glass, Andrew; Iancu, Laurențiu; Moore, Lisa; Liang, Hai; Ishida, Richard; Misra, Karan; McGowan, Rick, 4. Bengali, Recommendations to UTC #150 January 2017 on Script Proposals, 2017-01-21 
L2/17-016 Moore, Lisa, D.3.2, UTC #150 Minutes, 2017-02-08 
L2/17-130 Anderson, Deborah, Comments on L2/16-322 and L2/16-383, Sandhi marks for Bengali and Newa, 2017-04-19 
L2/17-153 Anderson, Deborah, 4. Bengali and Newa, Recommendations to UTC #151 May 2017 on Script Proposals, 2017-05-17 
L2/17-103 Moore, Lisa, D.3 Sandhi Mark, UTC #151 Minutes, 2017-05-18 
  1. ^ 提案中建議的碼位和名稱可能與最終結果不同。
  2. ^ 參見L2/01-303,L2/01-304,L2/01-305與L2/01-430R。

參考資料

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
文字
欧洲文字Ⅰ
現代文字與儀式文字
拉丁(基本 · 補充 · 擴展-A · 擴展-B · 擴展-C · 擴展-D · 擴展-E · 擴展-F · 擴展-G · 擴展附加 · 連字 · 國際音標擴展 · 音標擴展 · 音標擴展補充 · 希臘和科普特擴展 · 數字) · 科普特 · 西里爾(補充 · 擴展-A · 擴展-B · 擴展-C · 擴展-D · 格拉哥里(補充 · 亞美尼亞(連字 · 格鲁吉亚(擴展 · 補充
修飾符號(聲調 · 佔位 · 上下標 · 組合附加符號扩展 · 补充 · 符号用 · 组合半符号
欧洲文字Ⅱ
古代文字與其他文字
線形文字A · 線形文字B(音節 · 表意 · 數字) · 賽普勒斯 · 賽普勒斯-米諾斯 · 古安納托利亞(呂基亞 · 卡里亚 · 呂底亞) · 古義大利 · 盧恩 · 古匈牙利 · 哥特 · 愛爾巴桑 · 高加索阿爾巴尼亞 · 維斯庫奇 · 古彼爾姆 · 歐甘 · 蕭伯納
中东文字Ⅰ
現代文字與儀式文字
希伯來(表達形式 · 阿拉伯(補充 · 擴展-A · 擴展-B · 擴展-C · 表達形式-A · 表達形式-B · 敘利亞(補充 · 撒瑪利亞 · 曼達安 · 雅茲迪
中东文字Ⅱ
古代文字
古北阿拉伯 · 古南阿拉伯 · 腓尼基 · 帝國亞蘭英语Imperial Aramaic (Unicode block) · 摩尼 · 碑刻帕提亞英语Inscriptional Parthian (Unicode block) · 碑刻巴列維英语Inscriptional Pahlavi (Unicode block) · 詩篇巴列維英语Psalter Pahlavi (Unicode block) · 阿維斯陀 · 花剌子模 · 埃利邁 · 納巴泰 · 巴尔米拉 · 哈特拉
楔形文字與象形文字
楔形文字(數字和標點 · 早期王朝) · 烏加里特 · 古波斯 · 埃及聖書體(格式控制 · 麥羅埃文(草書體 · 聖書體) · 安納托利亞象形
南亞和中亞文字Ⅰ
印度官方文字
天城(擴展 · 擴展-A · 吠陀擴展 · 孟加拉 · 古木基 · 古吉拉特 · 奧里亞 · 泰米爾 (补充)  · 泰盧固 · 卡納達 · 馬拉雅拉姆
南亞和中亞文字II
其他現代文字
它拿 · 僧伽羅(古數字) · 尼瓦爾 · · 蒙古(補充 · 林布 · 梅泰(擴展 · 默禄 · 瓦蘭齊地 · 桑塔利 · 查克馬 · 絨巴 · 索拉什特拉 · 馬薩拉姆貢德 · 貢賈爾貢德 · 文喬 · 投投 · 唐薩 · 蒙達里
南亞和中亞文字Ⅲ
古代文字
婆羅米 · 佉盧 · 拜克舒基 · 八思巴 · 玛钦 · 札那巴札尔方形 · 索永布 · 古突厥 · 古粟特 · 粟特 · 回鶻
南亞和中亞文字Ⅳ
其他歷史文字
錫爾赫特 · 凱提 · 夏拉達 · 塔克里 · 悉曇 · 馬哈賈尼 · 科傑基 · 庫達瓦迪 · 木爾坦 · 底羅僕多 · 莫迪 · 南迪城文 · 古蘭塔 · 迪維希阿庫魯 · 阿洪姆 · 索拉僧平 · 多格拉
东南亚文字
 · 老挝 · 緬甸(擴展-A · 擴展-B · 高棉(符號 · 傣纳 · 新傣仂 · 老傣仂 · 傣越 · 克耶 · · 救世苗 · 創世紀苗 · 包钦豪 · 哈乃斐羅興亞
印尼和大洋洲文字
菲律賓(他加祿 · 哈努諾 · 布希德 · 塔格班瓦) · 卡維 · 布吉 · 巴厘 · 爪哇 · 勒姜 · 巴塔克 · 巽他(補充 · 望加錫
东亚文字
汉字(擴展-A · 擴展-B · 擴展-C · 擴展-D · 擴展-E · 擴展-F · 擴展-G · 擴展-H · 擴展-I · 兼容 · 兼容補充 · 部首 · 部首補充 · 筆畫 · 漢文訓讀 · 表意文字符號和標點 · 表意文字描述字符 · 注音(擴展) · 假名(平假名 · 片假名 · 语音擴展 · 補充 · 擴展-A · 擴展-B · 小型假名 · 半形全形 · 諺文(擴展-A · 擴展-B · 兼容 · 諺文音節 · 部首 · 女書 · 傈僳(補充 · 柏格理苗 · 西夏(部件 · 補充 · 契丹小字
非洲文字
埃塞俄比亚(補充 · 擴展 · 擴展-A · 擴展-B · 奧斯曼亞 · 提非納 · 西非 · 瓦伊 · 巴穆姆 (補充 · 巴薩 · 門地奇卡奎 · 阿德拉姆 · 梅德法伊德林
美洲文字
切羅基(補充 · 加拿大原住民(擴展 · 擴展-A · 歐塞奇 · 德瑟雷特
符号
標記系統
盲文圖案 · 音樂符號(拜占庭 · 茲納緬尼耶 · 古希臘) · 迪普卢瓦耶速记(格式控制) · 萨顿手语谱写
标点符号
一般標點(ASCII · 拉丁-1 · 補充 · 中日韓符號和標點表意文字 · CJK兼容(半形全形 · 小寫變體 · 豎排)
字母数字符号
类字母(羅馬符號) · 数学 · 阿拉伯数学 · 帶圈補充 · CJK帶圈補充 · CJK兼容
技术符号
数字
ASCII數字(全形) · 通用印度 · 科普特閏餘 · 算籌 · 楔形文字 · 印度西亞格 · 因努伊特 · 瑪雅 · 數字形式 · 奧斯曼西亞格 · 魯米 · 古僧伽羅 · 上下標
数学符号
箭頭(補充-A · 補充-B · 補充-C · 雜項和箭頭 · 数学字母数字符号(阿拉伯数学 · 字母式 · 數學運算符(補充 · 雜項數學-A · 雜項數學-B · 幾何圖形(擴展 · 製表符 · 方塊元素
绘文字与象形
什錦(裝飾符號) · 表情 · 雜項 · 雜項和圖符 · 補充和圖符 · 擴展-A · 交通地圖
其他符號
鍊金術 · 古代符號 · 貨幣 · 游戏符号(國際象棋和國際跳棋 · 棋類 · 多米諾 · 麻將 · 撲克 · 花色) · 雜項和箭頭 · 遗留計算 · 易經符號(兩儀四象八卦 · 六十四卦 · 太玄經) · 斐斯托斯圓盤
其他
特殊 · 標籤 · 变体选择符(补充 · 私用區(補充私用區-A · 補充私用區-B) · 代用區(高代用區 · 低代用區) · 非字符