二子從周提示您:看後求收藏(https://www.eisrjc.com),接著再看更方便。

[    【作者二子從周提示:如果章節內容錯亂的話,關掉閱讀模式,關閉廣告攔截即可正常】

]

-

「按照任昉《述異記》陸居曰熊,水居曰能的說法,還可以讓我們聯想到另外一個傳說。」爭

「傳說大禹治水,娶塗山氏,在工地豎起一麵鼓,讓塗山氏聽到鼓響,就送飯前來。」

「之後大禹就化作一頭大熊開山,結果有一日工作太投入,飛揚的石頭打到了鼓上,大禹卻冇有注意到。」

「塗山氏聽到鼓聲送飯過來,發現夫君居然是一頭大熊,受驚過度,化作了石像。」

「大禹悲痛萬分,對石像說你化作石像可以,把兒子給我留下啊。」

「說完石像中腹突然打開,一個小孩從石像裡掉了出來,這就是『啟』這個名字的由來。」

這一連串的故事和知識,讓對麵計算機係的大佬們都聽得津津有味,周至這才說道:「這傳說是不是也說明,大禹也繼承了鯀的能力,能夠變化成熊或熊(尼)?」

「而大禹是不是因為感受到父親的悽慘命運,最終決定打破禪讓製度,將天下傳給了自己的兒子?」爭

「是不是還能算作一個側證,證明大禹治水的傳說,是發生在陶石骨器並用的部落聯盟時代?」

「所以大家看,熊(尼),(骨係)這兩個生僻字如果真的消失了,是不是就會造成上述華夏文明部分資訊資料的缺失?是不是會在將來產生一些無法解答的疑案?會不會造成我們子孫的困惑?」

「以前是因為條件所限,國人受教育程度不高,快速普及文字,掃除文盲是重中之重,所以簡化字的推行勢在必然。GB2312也發揮了巨大的作用。」

「可如果現在條件明明已經允許了,如果我們已經有機會將所有的文字都採集下來,記錄下來,可我們還是無動於衷,讓這些文字就這樣消失在歷史的長河裡,而不將之留給子孫,會不會是一種將來的遺憾?」

「如果我們的子孫,因為我們的原因,今後不再知道熊(尼),(骨係)這兩個字以及這兩個字上說承載的歷史文化資訊的話,那我們該不該算是……民族的罪人?!」

「資訊技術最早出來之前,曾經有西方人認為,漢字必將因為計算機技術的誕生而消亡。」

「經過我們的努力之後,有了GB2312漢字編碼,向那些人證明瞭他們之前就是純粹的胡說八道。」爭

「而我認為,正是因為資訊技術的發展,解決了漢字書寫記憶困難的問題,漢字的推廣應用,甚至完全可能產生革新性的變化。」

「GB2312,證明瞭我們能行,GB13000,證明瞭我們能夠做得更好,那麼我們為什麼不趁熱打鐵,乾脆就一次性給它做到極致?」

「做到極致是什麼意思?」李紅江再不敢輕視眼前這小孩了,他是真不知道漢字中承載的這些東西,或者說壓根冇有重視。

這也是如今中國學界普遍的一種想像,瘋狂追趕階段,哪裡還敢追求完美?現階段夠用,解決當前問題,就已經是絕大多數理工科學者的最高目標了。

「做到極致的意思,就是新的字庫編碼,要做到歷史全相容,當前全收集,未來可拓展。」周至倒是一點不怵:「歷史全相容的意思,就是新的字庫,可以完全相容GB2312和GB13000編碼。已經用這兩種編碼錄入的文字資訊,用新的編碼同樣能夠完整地讀出來。」

「當前全收集,則指當前我們已知的漢字元號,包括大陸簡化字,寶島、港澳、新島的繁體字,還有島國,朝韓所用的一些漢字元號,全部採納到新編碼體係中來。」

「未來可拓展的意思,就是要給字庫留夠充足的冗餘編碼空間,給將來採集更多的文字元號做好準備。」周至侃侃而談:「剛剛旦增大師已經說了,我國是多民族的國家,很多民族都有自己的文字,這些文字,同樣是我們華夏一族大家庭的瑰寶。」爭

「因此我們要留足這個字庫的拓展空間,以備將來時機成熟後,將這些少數民族的文字也收納進來。」

「這就是我的設想,關於華夏標準大字庫的設想。」

「呃……周至同學。」李紅江倒也是光棍:「我給你道個歉,也給辜老和旦增大師道個歉,之前自己的確冇有意識到這個問題的重要性。」

「但是我之前已經說了,GB13000是根據ISO/IEC1064來設計的,通用多八位編碼字元集的碼位就隻有兩萬多個,就好像一個養殖場,雞籠子就這麼多,實在是裝不下你們說的這麼多雞啊?」

「所以說這個多八位編碼字元集是有問題的呀,不適閤中國的需要呀,那我們為什麼還要湊合著用呢?」周至反問道。

「要是不用這個,那又用哪個呢?」李紅江倒是不覺得周至是在無理取鬨,能夠提出問題來不是本事兒,關鍵是問題提出來之後,你還得能夠解決問題纔算。

「為什麼不用UNICODE呢?」爭

「UNICODE?」李紅江想了一下:「UNICODE八字還冇一撇吧?國際標準都還冇有出來,我們哪來的參照?」

Unicode的漢語翻譯,叫做統一碼,也叫萬國碼、單一碼,是由統一碼聯盟開發的一項計算機科學領域裡的業界標準,主要就包括字元集和編碼方案。

統一碼是為瞭解決傳統的字元編碼方案的侷限而產生的,它為每種語言中的每個字元,設定了統一併且唯一的二進位編碼,以滿足跨語言、跨平台進行文字轉換、處理的要求。

統一碼設計之初的目的,就是為了打造一個能夠容納世界上所有文字和符號的字元編碼方案。

其設計思路,就是用數字0-0x10FFFF來對映所有字元,最多可以容納1114112個字元,或者說有1114112個碼位。

後世大家所熟悉的UTF-8、UTF-16、UTF-32,其實都是將數字轉換到程式數據的編碼方案。

當然這些碼位也不是隨便亂用的,而是規定了區間,比如上一世給漢字使用的區間,就是3400-4DBF,4E00-9FFF,20000-3FFFF三段,稱作:中日韓越統一表意文字區間。爭

這就有一百多萬個碼位,裝下所有漢字綽綽有餘。

因為不存在上限,UTF理論上還可以繼續擴展。

當然從上一世的經驗來看,也完全冇有這個必要,足夠用了。

()

1秒記住網:.

-

相關小說閱讀More+

葉芷萌厲行淵全文免費閱讀

乖順替身藏起孕肚成首富

鐘嘉薇,譚俊達

一世梟龍

方羽_修煉_五_千_年

李道然

葉止萌 曆行淵全文閱讀

分手後她藏起孕肚繼承億萬家產

唐楚楚江辰 628章

龍王醫婿

分手後她藏起孕肚繼承億萬家產

葉芷萌厲行淵

唐楚楚江辰聽

龍王醫婿

唐楚楚江辰全文

龍王醫婿

方羽唐小柔_

佚名
本頁麵更新於2022

本站所有小說均由程式自動從搜尋引擎索引

Copyright © 2022 https://www.eisrjc.com