操作系統(tǒng)中文環(huán)境的特色概述的
GNU/Linux 的 I18N 環(huán)境的發(fā)展,到了glibc-2.2 系列正式問世后,才算完全成熟。它不僅完全支持 Unicode 環(huán)境,同時(shí)在 I18N 與 L10N 方面還擁有許多先進(jìn)的特色述如下: 1. glibc 內(nèi)部的編碼轉(zhuǎn)換系統(tǒng) (iconv) 擁有共同的「基底字集」,該基底字集采用 UCS4 編碼,目前仍持續(xù)擴(kuò)編當(dāng)中,理論上將可以函蓋世界上所有已知的編碼系統(tǒng)的轉(zhuǎn)換對(duì)應(yīng)。透過基底字集,可以達(dá)到完善的轉(zhuǎn)碼機(jī)制。同時(shí),由于在各語系下其多字節(jié)編碼轉(zhuǎn)成寬字符時(shí),其實(shí)就是轉(zhuǎn)成 UCS4,這在將來 Unicode通行時(shí),將有利于數(shù)據(jù)的處理。 2. glibc 內(nèi)部擁有數(shù)量龐大的編碼轉(zhuǎn)換表,大部分是各編碼系統(tǒng)與 UCS4 的轉(zhuǎn)換用,也有一些是用于不同編碼間直接轉(zhuǎn)換。所有的轉(zhuǎn)換表皆采動(dòng)態(tài)模塊加載的方式供應(yīng)用程序使用,故只有在需要時(shí)系統(tǒng)才會(huì)自動(dòng)加載所需的轉(zhuǎn)換表來執(zhí)行,使用完畢后可以卸下,不會(huì)浪費(fèi)內(nèi)存空間。 3. glibc 擁有完整的 I18N 過程調(diào)用接口,以及完整的 Unicode 輸出入與處理的呼叫接口。 4. 在地區(qū)環(huán)境方面,glibc 將「字集」與「編碼」的概念分開。一個(gè)地區(qū)環(huán)境資料庫有一個(gè)明確的字集,代表這個(gè)地區(qū)語文可能會(huì)使用到的所有文字符號(hào),而這個(gè)字集可以自由選擇一個(gè)編碼系統(tǒng)來套用。例如我們臺(tái)灣地區(qū)的字集包含所有的中文字 (簡(jiǎn)繁體都有),如果我們選用 Big5 編碼,則地區(qū)環(huán)境數(shù)據(jù)庫名稱就是 zh_g5;若我們選用 EUC-TW 編碼,則名稱就是 zh_ctw;當(dāng)然我們甚至可以選用 GB2312 或 Unicode 等編碼來套用。 ·然而,由于各編碼所能包含的字?jǐn)?shù)是固定的,同時(shí)它們也只能包含特定的字集,因此,僅管我們的中文字集包含了所有的中文字,但一旦選定編碼系統(tǒng)后,其所能使用的中文字自然僅限于該編碼系統(tǒng)所包含的范圍。因此,假如我們選用Big5,就表示在此環(huán)境下無法使用簡(jiǎn)體字;反之若選用GB2312 亦然。 5. glibc 中各地區(qū)環(huán)境預(yù)設(shè)的編碼系統(tǒng)與傳統(tǒng)的 UNIX 系統(tǒng)稍有不同。所謂的「預(yù)設(shè)編碼系統(tǒng)」指的是在 \"_\" 這樣的地區(qū)環(huán)境數(shù)據(jù)庫名稱中,所采用的編碼系統(tǒng)。傳統(tǒng)的 UNIX 系統(tǒng)中所采用的預(yù)設(shè)編碼系統(tǒng)多半是依照官方或業(yè)界的標(biāo)準(zhǔn),例如在臺(tái)灣地區(qū)就是 EUC-TW。而在 glibc 中,則是以當(dāng)?shù)刈顝V泛流通的編碼系統(tǒng)做為預(yù)設(shè)。 · 更進(jìn)一步地,glibc 會(huì)自動(dòng)將未登錄的編碼系統(tǒng)名稱,改以其地區(qū)環(huán)境的預(yù)設(shè)編碼系統(tǒng)來取代。例如我們將語系環(huán)境設(shè)定為 zh_ctw,由于 \"euctw\"在 glibc 內(nèi)部已有登錄,故它就會(huì)采用 EUC-TW 做為此環(huán)境下的編碼系統(tǒng)。萬一我們將語系環(huán)境設(shè)定為 zh_known,由于 \"unknown\" 一字沒有登錄,故glibc 會(huì)自動(dòng)以 zh_TW 預(yù)設(shè)的編碼系統(tǒng) Big5 來取代。 6. 在訊息顯示方面,各應(yīng)用程序的訊息翻譯只需依各語文地區(qū)分別保留一份即可,不需要分別為不同的編碼系統(tǒng)都保留一份。以臺(tái)灣地區(qū)中文為例,我們只需要一份 zh_TW 的訊息即可,至于它是用 Big5 寫成的,或 EUC-TW 寫成的都沒關(guān)系。假如它原來是以 Big5 寫成的,但我們卻希望以 EUC-TW 來顯示時(shí),glibc會(huì)自動(dòng)為我們做好轉(zhuǎn)碼的工作。 ·也許有人會(huì)問,那我們只需要保留一份 zh (即中文) 的訊息就好了嘛,這樣豈不是兩岸三地都可使用了?然而這么做并不恰當(dāng),原因是兩岸三地因歷史背景與文化的隔閡,各自發(fā)展成獨(dú)特的語文,或稱「地區(qū)性方言」,對(duì)同一個(gè)句子的翻譯,可能兩岸三地的翻法都各自不同。故我們不能單純用轉(zhuǎn)碼的方式,直接將臺(tái)灣地區(qū)的翻譯轉(zhuǎn)成簡(jiǎn)體字供對(duì)岸使用,而必須為他們分別保留一份他們自己的訊息翻譯。 7. 在訊息翻譯的維護(hù)工作,以及系統(tǒng)函式的呼叫接口上,各 UNIX 系統(tǒng)的實(shí)作方式都不盡相同。而在 glibc (或所有的 GNU 系統(tǒng)、程序) 中,則統(tǒng)一使用 GNUgettext,以方便程序撰寫以及后續(xù)的翻譯維護(hù)。 8. 在地區(qū)環(huán)境數(shù)據(jù)庫中,除了上述那幾個(gè)傳統(tǒng)的類別之外,新一代的 glibc-2.2還擴(kuò)增了以下的類別: LC_PAPER,LC_NAME,LC_ADDRESS,LC_TELEPHONE,LC_MEASUREMENT,LC_IDENTIFICATION
就要切換其能力來和外星生物們進(jìn)行戰(zhàn)斗。 這些是根據(jù) ISO/IEC JTC1/SC22/WG20 N690 (1999/06) 的新規(guī)范而來,用以描述更多的地區(qū)性慣例,如住址格式、號(hào)碼格式、抬頭稱位 .... 等等。
海口治療包皮過長多少錢小孩積食怎么辦
廣州治療婦科習(xí)慣性流產(chǎn)費(fèi)用
- 男子偽造才可倒賣物資被上海警方查處
- 親爸帶娃想沒用,給娃制作了一個(gè)“簡(jiǎn)易秋千”火了,網(wǎng)友:厲害了
- 孕七個(gè)月初產(chǎn)檢“無胎心”,多和這些因素有關(guān),孕媽可要注意防范!
- 韓衛(wèi)東:供需錯(cuò)配導(dǎo)致今年市場(chǎng)震蕩非常大
- 高精地圖受到限制了自動(dòng)駕駛“進(jìn)城”?
- 服喬布斯不服坎貝爾,蘋果傳奇設(shè)計(jì)團(tuán)隊(duì)解散內(nèi)幕曝光
- 河南省市場(chǎng)監(jiān)管局抽檢16大類1856廠內(nèi)食品樣品,合格1820廠內(nèi)
- 劉畊宏躺贏!帕梅拉被曝買水軍洗白錄播,水軍文集也被揭發(fā)是謊話
- 現(xiàn)在起至7上半年上海各區(qū)每周周末安排一次社區(qū)篩查
- Mysteel日?qǐng)?bào):黑色金屬期貨先跌后上漲
- 豬肉機(jī)器價(jià)格,豬肉機(jī)多少錢?
- 男人不并不知道你4件事,說明你在他心里什么都不是