夏理文 v1.2 設計文檔

展示和示例文本

意字表

berti
brife
solri
gleki
fanva
troci
djuno
traji
vlipa
litru
dasni
glare
kosta
klama
simxu
tugni
clira
snada
gasnu
cupra
zenba
rinka 使
zukte
tagji
dirce 耀
milxe
glare
bilga




北風 熱衣

北風最製 使北風
耀柔熱
北風必約北風

ni'o la berti brife jo'u la solri
la .aisopos.
la gleki cu fanva
.i la berti brife jo'u la solri pu troci leka djuno ledu'u makau traji leka vlipa vau fo le'i me lenei .icabo le pa litru noi dasni lo glare kosta cu mo'u klama
.i lu'i le remei pu simxu leka tugni fi lenu traji leka vlipa fa le traji be leka clira fa lonu ce'u snada leka gasnu lenu le pa litru co'u dasni le kosta
.i baku la berti brife co'a traji cupra le brife .i ku'i lonu by.by. zenba leka cupra le xokau brife cu rinka lonu le pa litru cu zukte leka zenba leka sela'u li xokau se tagji le kosta .ibazabo la berti brife co'u troci
.i baku la solri co'a dirce lo milxe glare .ibazibo le pa litru co'u dasni le kosta
.iseki'ubo la berti brife co'a bilga tugni fi lonu la solri cu traji leka vlipa vau fo la berti brife ce la solri

前言

2021年夏,金毛狸狗(geezmolycos / la .langer.,人名)爲 lojban 設計了一種書寫系統。金毛狸狗比較喜歡東亞文化,他當時在 omniglot 上面看到了很多人造的書寫系統,當時他正在學習 lojban,力求學到他當時英語的水準,可惜最後沒學到那個水準,但學習 lojban 的過程讓他的思維得到了鍛鍊,擁有了一些別樣的思維方式,還有對語言的一些別樣的認識。lojban 最後成爲了他最喜歡的人工語言。

金毛狸狗設計的書寫系統他決定命名爲「夏理文」,其中「夏」是創造出來時候的季節,又代表「華夏」之意,因爲其中使用了漢字;「理」則代表邏輯語名稱中「邏輯」的部分。金毛狸狗使用筆和草稿本於2021年春編寫了夏理文的第一版 (v1.0),其中代表邏輯語 x 的部件形如「木」,之後,他在實驗和實踐中創作了 v1.1, 將代表 x 的部件修改成「」並重新編寫了組詞規則和成文規則,使用鉛筆和A4紙編寫了一個簡單的文檔「夏理文手稿」。他本想編寫完善以後,整理好發佈到互聯網(互相聯通的網絡)上,但是後來因爲沒有學習編譯原理,他在設計最後一部分「文字使」的時候,因爲沒有理論指導,無法有效設計,無限期延遲了文檔完成。最後,在2025年2月他整理物品時翻到了未完成的手稿,決定將其簡單拍攝成pdf文檔後,發佈在「中國邏輯語社區」QQ群中,後來得到了一定的反響和支持。在群友的幫助下,金毛狸狗,對現代 lojban (分裂)的形態學和各種改革提案更新了認識。於是在內驅力達到閾值後,2025年12月12日他決定編寫一篇內容更詳盡,更適合大衆參考使用的夏理文文檔,這個時候也應該做一些小改動,增加一些新的內容,去掉一些過時內容。

簡介

夏理文是一種實驗性的書寫系統,專爲 lojban 設計,是一種全音素表音文字(夏理構字)和漢字混合的書寫系統,類似當今用來書寫日語的漢字假名混寫;其中表音部分按照音節呈塊狀拼寫,類似朝鮮半島地區使用的諺文。夏理文是一種新創造的書寫系統,雖借鑑漢字、假名、諺文書寫系統特徵,但卻爲 lojban 量身定製,且從頭開始設計。夏理文是一種比較複雜的書寫系統,其組織好的文本可以視作一個層次結構,每個層級都有一系列的要素和規則,自底向上由基本部件和符號,依據每層級的規則組織成更大的結構,最後排版成爲完整的文本。

本文是一個設計文檔,會從設計者「金毛狸狗」的角度詳盡介紹這個書寫系統和其中的每個部分,還會介紹每個部分的設計思路,並給出一些例子方便讀者使用這個書寫系統。本文不是一部教程,因爲金毛狸狗暫時沒有精力去編寫教程,但是也可以看這個來學習。本文主要分爲三大部分:

lojban 已經在不同群體和情況下演化了很長時間,在 CLL lojban 以後,又不斷有提案,魔改和野外用法改變這個語言,在形態學上 lojban 也不能避免這樣的演變。夏理文的設計主要是爲比較現代的 lojban 形態學設計的,但是我的精力和能力不足以構建出一個完整的定義,什麼是現代的 lojban 形態學。因此,這個文章的內容,如果能用就是能用,不能用,那可能就是不能用,讀者需要自己考慮。夏理文也會兼容一些對 lojban 形態學的擴展,例如 輔音-半元音-元音 的音節結構,例如 eu 雙元音,以供讀者更自由地使用。

lojban 夏理 Latin 正字法

計算機視角下的 lojban 文本所代表的本質就是一系列分開的詞語(詞語列表),而我們人在使用 lojban 的時候,具體到聽、說、讀、寫,在說和寫的時候是有一定的自由裁量權的。就寫來說 lojban Latin 書寫系統是比較鬆弛的,同樣的文本,有的地方可以自由選擇一些寫法,不同的人有不同的書寫習慣,例如:

la .alis.andyrsyn. cu pu'o citka lo nimre .i lonu citka cu cfari ca lo prulamdei

la .alis. .andyrsyn. cu pu'o citka lo nimre .i lo nu citka cu cfari ca lo prulamdei

甚至

la.alis.andyrsyn.cupu'ocItkalonImre.ilonucItkacucfAricaloprulAmdei

這些對同一個文本的不同寫法,都是等價且合法的,這些寫法都表示同樣的一個分詞結果,都代表着一系列在分詞上等價的語音流。不影響計算機解析結果,也不影響閱讀者接收的結果(可能會影響閱讀的困難程度,但是對於一個理性的閱讀者來說,它分析出的文本結構不會變化)。

lojban 的說話系統也是相對松馳的,例如上文的 lo nu citka 中間就可以完全不停頓讀作 lonuCITka,也可以每個詞都停頓一下讀作 lo.nu.CITka,甚至重音有的地方也是可以自由裁量的,例如這個 lo nu citka 如果完全不停頓可以讀爲 LOnuCITkalonuCITka,並不影響聆聽者接收的分詞結果。

lojban 文本本質和表示法示意

lojban 表示法的在 Latin 書寫系統或發音上的自由裁量權,與夏理文允許的自由裁量權有不同之處,我們直接制定一種變體的 Latin 正字法(稱爲夏理 Latin 正字法),從 lojban 詞語列表出發,在通用 Latin 正字法的基礎上,僅包括夏理文需要使用的自由裁量權(包括雙元音被視作整體還是分開,分詞需要的重音和停頓等),這樣有利於我們後面爲夏理文制定規則時準確說明。

從 lojban 詞語列表出發,我們認爲,每個詞語由許多音素組成,包括含y單元音、雙元音、半元音、輔音、h音(y'y 即 Latin 正字法中的撇號)幾類,其中含y單元音、雙元音可以是重音或非重音。每類音素包括(寫作通用 Latin 正字法的表示):

其中 (w) 表示 lojban 某些方言或提案可能會加入的高元音,發音可以是国际音标 ɨ 或 y。而 eu 是 lojban 某些方言或提案可能会加入的双元音。
這些音素在我們的正字法中對應寫作:

其中雙元音的字符僅對應被視作整體的雙元音,例如 cmavo 中的雙元音。形態學上分開的雙元音可寫作 aɩ eɩ oɩ aʊ,例如 rafsi 的雙元音。雖然這樣說,但是這不影響文本解析,只是一種風格上的建議。喉爆發音是被視作詞語內部所包含的喉爆發音,而不是分隔詞語的停頓。我們認爲現代 lojban 沒有這種用法,因爲我們認爲停頓和喉爆發音的作用是相同的,都是顯式分隔詞語。爲了兼容一些可能的擴展和用法,我們設置了表示詞語內部喉爆發音的字母 ʔ。

詞語的語音組合法(phonotactics)這裡不涉及,但是我們可以認爲你使用的 lojban 方言的語音組合法適用。分詞方法這裡也不涉及,也是認爲已經有一個分詞方法了。

之後就是詞語的形態學重音,重音非重音是某個具體實現,其中的每個字母的重音與否是根據實際(分詞方法)得到的,而不是給定一系列空格(停頓)分開的詞語,問哪個字母能重音。也就是說這不是和 lojban 詞語列表一一對應,而是根據具體情況具體書寫。至於 cmevla,重音不影響形態學分詞,因此 cmevla 的重音如果有,均要顯式寫明。CLL 中倒數第二個音節(是否跳過y存疑)重音的規則在此不適用,如果重音必須顯式寫出。形態學重音我們使用附加銳音符 ◌́(acute) 表示,優先使用 unicode 分離形式(Normalization Form D),如下:

最後,詞語中形態學的非重音如果要強調,我們使用附加鈍音符 ◌̀(grave)表示,但是也可以不寫,不寫默認就是非重音,如下:

最後是停頓,我們使用空格表示形態學上可選的實際停頓。對空格的用法,我們只關注是否在使用語言時實際停頓了,例如用夏理文記錄說話語音流中實際的停頓,或者在書寫時追求某種特定文字風格。如果實際上沒有停頓,則不使用空格,直接連寫。

我們也要考慮點號,點號在通用 Latin 正字法中表示形態學上必須有的停頓(我們認爲喉爆發音(ʔ, glottal stop)和停頓是一回事),而在夏理 Latin 正字法中,點號是一個可選的東西,可有可無。如果有,它與空格是等效的。點號可以根據具體使用者的需求而確定用途,例如像通用 Latin 正字法一樣表示形態學上必須有的停頓,或者只用來標記特定的詞類(如只用來環繞 cmevla),這個是具體的夏理文上層規則中需要涉及到的。

總得來說,重音信息、停頓信息、點號信息,都是爲了分詞算法服務的。我們把夏理 Latin 正字法寫出的文本中,空格隔開的各部分稱作片段,一個片段可以包括許多詞語。

下面是一些使用夏理 Latin 正字法和通用 Latin 正字法,表示同樣的詞語列表的對比:

通用 .i do mi prami .i mi do prami .i la .micuueBIN.tcyn. titla melbi
夏理 idomiprámi imidoprámi ila micuʊebín tcyn títlamélbi
夏理 i do mi prami i mi do prami i la.micuʊébin.tcyn.titla melbi

通用 do dicra .e'a mi ca la .daucac. bi'onai la .gaicac.
夏理 do dícra e'a mi ca la dá̮cac bi'oną la gą́cac

通用 loi sodvrkokakola cu mo'i farlu le boltipyboi le ti botpi
夏理 lǫ sodvrkokakóla cu mo'i fárlu le boltípyboɩ le ti bótpi

夏理文書寫系統層級結構及定義

夏理文書寫系統由衆多層級組成,它基本上是一個自頂向下的金字塔結構。如下圖所示,頂層的夏理文是由下層的結構逐級按照規則組織而成的。組織好的夏理文文本,可以視作一個層次結構,由基本部件、符號等依據每層級的規則逐步組成更大的結構,最終排版成完整的文本。整個體系的基礎是我們上一節中規定的夏理 Latin 正字法,我們從 Latin 正字法表示的文本內容出發,使用各種部件按規則構成夏理文文本。

夏理文書寫系統層級結構圖

夏理文書寫系統自下而上,首先是基本部件,包括

其中,構字是夏理文的表音文字部分,意字是夏理文假借漢字的部分,而標點子系統,則是夏理文整體運作的一些補充成分。構枝、構幹分別爲代表輔音、元音的基本部件。意字葉是確定假借漢字 rafsi 形式的修飾符,意字花是確定假借漢字形成 lujvo 時標準化形式的修飾符,標點子系統會在之後詳細介紹。

構字和意字兩種子系統,受組詞規則的支配,組成詞語。夏理文的組詞規則包括一系列可選的範式,分別適用於不同的詞語風格要求,可以按照習慣將他們對應於不同的 lojban 詞類。詞語依據素文規則形成素文,即不含標點的文本。標點不影響文本解析爲詞語列表。素文和標點子系統結合爲完整的夏理文書寫系統。

名稱表

下面是夏理文中各概念的漢語名稱、英語名稱、lojban 名稱表:

漢語名稱 英語名稱 lojban 名稱
夏理文 Aestivologica script cislojlerci'e
Latin 正字法 Latin orthography glilermo'a
夏理 Latin 正字法 Aestivologic Latin orthography cislojglilermo'a
構枝 compositional branch turle'u jimca
構幹 compositional trunk turle'u stani
立式 vertical form sraji
臥式 horizontal form pinta
構字 compositional character turle'u
平株 plain construct sampu selzba
漢字 Chinese character jugle'u
意字葉 logogram foliage smulerpezli
意字株 logogram construct smule'u selzba
意字花 logogram blossom smulerxrula
花林 blossom complex xrula gumselzba
訓字 assigned logogram character krati smule'u
訓字株 assigned logogram construct krati smule'u selzba
訓字林 assigned logogram complex krati smule'u gumselzba
意字 logogram smule'u
construct selzba
詞語 word valsi
素文 basic text jadycaʊ vlameɩ
標點 punctuation mark padle'u
韻符 tone mark togle'u
頂標 top mark gapselci'a
上標 superscript galselci'a
中標 midscript mijyselci'a
下標 subscript dziselci'a
底標 bottom mark nitselci'a

構字株名稱

漢語名稱 英語名稱 lojban 名稱
泛單株 generic singular construct fadni pamei turselzba
泛終株 generic final construct fadni fanmo turselzba
泛間株 generic interposed construct fadni midju turselzba
泛雙株 generic double construct fadni remei turselzba
疊幹株 stacked trunk construct rapli stani turselzba
疊二株 stacked double constuct rapli remei turselzba
長終株 long final construct clani fanmo turselzba
長間株 long interposed construct clani midju turselzba
根終株 gismu final construct gismu fanmo turselzba
根間株 gismu interposed construct gismu midju turselzba

意字葉及意字花名稱

漢語名稱 英語名稱 lojban 名稱
終葉 final foliage fanmo smulerpezli
間葉 interposed foliage midju smulerpezli
雙葉 double foliage remei smulerpezli
疊葉 stacked foliage rapli smulerpezli
長葉 long foliage clani smulerpezli
本葉 main foliage ralju smulerpezli
漢語名稱 英語名稱 lojban 名稱
短花 short blossom tordu smulerxrula
續短花 unfinished short blossom nalmu'o ke tordu smulerxrula
長花 long blossom clani smulerxrula
續長花 unfinished long blossom nalmu'o ke clani smulerxrula
短名花 short cmevla blossom tordu cmevla smulerxrula
續短名花 unfinished short cmevla blossom nalmu'o ke tordu cmevla smulerxrula
長名花 long cmevla blossom clani cmevla smulerxrula
續長名花 unfinished long cmevla blossom nalmu'o ke clani cmevla smulerxrula

規則範式名稱

漢語名稱 英語名稱 lojban 名稱
平詞範式 plain word normal form (PWNF) jvamapti le sampu valsi
泛詞範式 generic word normal form (GWNF) jvamapti le fadni valsi
複構詞範式 compound compositional word normal form (CCWNF) jvamapti le selpau stura valsi
複葉詞範式 compound foilaged word normal form (CFWNF) jvamapti le selpau pezli valsi
複花詞範式 compound blossomed word normal form (CBWNF) jvamapti le selpau xrula valsi
平文範式 plain textual normal form (PTNF) jvamapti le sampu vlamei
泛文範式 generic textual normal form (GTNF) jvamapti le fadni vlamei
構文範式 compound textual normal form (CTNF) jvamapti le selpau vlamei
葉文範式 foliaged textual normal form (FTNF) jvamapti le pezli vlamei
花文範式 blossomed textual normal form (BTNF) jvamapti le xrula vlamei

標點名稱

漢語名稱 英語名稱 lojban 名稱
句讀點 punctuation marks padle'u
dot denpa bu
頓點 backcomma fendi bu
讀點 comma ra'arju'a bu
句點 period jufra bu
層次號 hierarchical marks vlamei pagbu lerfu
卷號 volume mark cukta bu
篇號 part mark ckupau bu
章號 chapter mark ckupaupau bu
節號 section mark ckucibypau bu
段號 paragraph mark jufmei bu
項目號 iteming marks liste lerfu
條目號 article mark pavmoiste bu
點目號 clause mark relmoiste bu
項號 entry mark cibmoiste bu
目號 item mark vonmoiste bu
引號 quotation mark lu bu, li'u bu
雙引號 double quotation mark lu bubu, li'u bubu
括號 bracket to bu, toi bu
雙括號 double bracket to bubu, toi bubu
下劃線 underline nitli'i barna
雙下劃線 double underline relpi'i ke nitli'i barna
底標點 bottom dot nityji'o barna
空底標點 hollow bottom dot nitydjine barna
漢語名稱 英語名稱 lojban 名稱
高調號 high tone mark jakto'a togle'u
低調號 low tone mark ganto'a togle'u
升調號 rising tone mark zento'a togle'u
降調號 falling tone mark jdikyto'a togle'u
峰調號 rising-falling tone mark zenjdikyto'a togle'u
谷調號 falling-rising tone mark jdikyzento'a togle'u
強音號 high volume mark cladu togle'u
弱音號 low volume mark tolylau togle'u
長音號 long sound mark clatei togle'u
短音號 short sound mark tortei togle'u
緊音號 tense sound mark trati togle'u
鬆音號 lax sound mark toltrati togle'u

符號表

爲了方便下文討論,在這裡定義一些用到的符號和縮寫

符號或縮寫 全稱 解釋
<V> 含y單元音(Vowel) 包括 a e i o u y (w),無論重音形式
<V́> 含y單元音重音形式 包括 á é í ó ú ý (ẃ)
<V̀> 含y單元音非重音形式 包括 à è ì ò ù ỳ (ẁ)
<V\y> 不含y單元音 包括 a e i o u (w),無論重音形式
<D> 雙元音(Diphong) 包括 ą ę ǫ a̮ (e̮),無論重音形式
<D́> 雙元音重音形式 包括 ą́ ę́ ǫ́ á̮ (é̮)
<D̀> 雙元音非重音形式 包括 ą̀ ę̀ ǫ̀ à̮ (è̮)
<VD> 單元音和雙元音 -
<G> 半元音(Semivowel/Glide) 包括 ɩ ʊ
<C> 輔音 包括 p b t d k g f v s z c j x m n l r
<CG> 輔音和半元音 包括所有輔音和半元音
<CGh> 含h輔音和半元音 包括所有輔音、半元音、h音
<CGh.> 含h和.輔音和半元音 包括所有輔音、半元音、h音、點號(停頓/喉爆發音)
上述項的排列組合可自行推斷含義

構字

構字是夏理文的表音文字部分,是全音素表音文字,每一個音素都要完整寫出(部分情況下 h 可省略)。構字的基礎是部件。部件是構字中的最小單位,不可再分。一個構字部件表示一個音素。基礎的構字部件分爲兩類,一類叫作「構枝」,包含<CGh.>(輔音類音素),另一類叫作「構幹」,包含<VD>(元音類音素)。各部件列舉在下面兩小節。

構枝

構枝是構字部件中用來表示<CGh.>類音素的。所有構枝字形的列表爲:

p b t d k g ʔ
f v s z c j x '
m n l r ɩ ʊ
0 1

0: 代表未標記的空構枝,不對應音素。代表空的音素,用途爲填充空位。
1: 代表標記的空構枝,不對應音素。

構枝可以佔據 1x1 株大小(全角),也可以佔據 0.5x1 或 0.5x0.5 株大小(左右半角、小角),在合法但不規範的情況下也可以佔據 1x0.5 株大小(上下半角)。這將會在「構字株」一節中詳細解釋。下面是一個例子:

全角: 左右半角: 小角: (上下半角:

各部件的起名方式是「構枝 {輔音名稱}」,例如 叫作「構枝 s」或「me me'o sy. stura jimca」。
空構枝的名稱叫作「空構枝」或「sucta stura jimca」,未標記和標記變體分別稱作「未標記空構枝」或「na'e tcita sucta stura jimca」,「標記空構枝」或「tcita sucta stura jimca」

構幹

構幹是構字部件中用來表示<VD>類音素的,所有構幹字形的列表爲:

a e i o u y (w) ai ei oi au (eu)
立式
立式(重音)
臥式
臥式(重音)
0 1
立式
臥式

0: 代表未標記的空構幹,不對應音素。代表空的音素,用途爲填充空位。
1: 代表標記的空構幹,不對應音素。

構幹可以佔據 1x1 株大小(全角)或 0.5x0.5 株大小(小角),構幹分爲立式和臥式兩種形式,還分爲重音與非重音變體。立式構幹可以佔據 0.5x1 株大小(左右半角),在合法但不規範的情況下還可以佔據上下半角,而臥式構幹可以佔據 1x0.5 株大小(上下半角),或在疊幹株的左半邊佔據 0.5x1 株大小(左半角)。構幹的兩種形式是服務於不同結構的構字株的,將會在後面詳細說明。

立式:全角: 左右半角: 小角: (上下半角:

臥式:全角: 上下半角: 小角: (左右半角:

各部件的起名方式是 「構幹 {重音}{立式/臥式}{元音/雙元音名稱}」,例如 叫作「構幹 重音臥式u」 或 「terbasna pinta me me'o ubu stura stani」。
空構幹的名稱叫作「空構幹 {立式/臥式}」或「{sraji/pinta} sucta stura stani」,未標記和標記變體分別稱作「未標記空構幹 {立式/臥式}」或「{sraji/pinta} na'e tcita sucta stura stani」,「標記空構幹 {立式/臥式}」或「{sraji/pinta} tcita sucta stura stani」

構字部件設計原則

根據上面那個「株」的類比,「構枝」「構幹」它們的名字解釋了他們的地位和設計風格。在組合構字株中,構枝是依附於構幹存在的,因爲輔音一般需要跟隨元音存在。構枝的筆畫總體以斜線爲主,而構幹的筆畫總體以直線爲主,且外形相對細長,以便設計立式、臥式兩種形式,且讓組合時壓縮變形不丟失細節。我在設計構枝的字形時,是將不同屬性的幾組分別設計的。首先我借鑑了 zbalermorna 的字形設計的對稱性,zbalermorna 是另一種爲 lojban 設計的書寫系統,它的文本總體風格比較類似帶附標的 Latin 字母。

示例:        

這種書寫系統是一種元音附標文字,它的輔音是基礎字母,元音是輔音上附加的標記。其中輔音字母它的字形設計,成對的清濁輔音,字形互爲180度對稱,且爆發音 (stop) 、(無噝)擦音 (fricative)、有噝擦音(sibilant)這三種類別的輔音字形伸出的主幹處在不同位置,特徵相似的輔音其字形上有共通之處。夏理構字部件也借鑑了這個設計特徵,輔音我先分爲了爆發音、擦音、鼻音及(邊)近音三類,每組其中又有若干對清濁輔音,鼻音和(邊)近音沒有清濁屬性,則仿照 zbalermorna 將其手動組成對。

首先,爆發音和擦音的字形設計,先由清爆發音開始。p/t/k 三者字形重心依次靠下,且三者最下方均不足兩個伸展的筆畫,而是爲撇/橫/點這樣的筆畫,象徵着爆發音的阻塞,也讓人聯想到諺文的 ㄱ ㅋ 等字母。爆發音和相同部位的擦音對應的輔音字形大致互呈180度翻轉對稱。例如 p () 和 f () 字形互爲180度對稱。f/s/c/x 重心對應依次提高,且 f/s/c 下方均有兩個伸展的筆畫,其字形與諺文的 ㅅ ㅈ ㅊ 等(塞)擦音類似。濁音是由清音增添一個筆畫構成的,增添的筆畫首先考慮在中間增添橫線,如果不適合書寫,則在末端增添一個點,或在首端增加一個撇。

其次,鼻音及(邊)近音的字形設計是以 l 爲基礎的,使用注音字母 ㄌ 的字形,漢語「力」字的聲母得到的啓發,由於 m/n/l/r 這四個輔音之間沒有明顯的對立關係,我就將這個字形旋轉、翻轉,形成四個互相對稱或旋轉對稱的字形。

停頓和 h 音這兩個音素,是仿照爆發音和擦音的對立關係創建的,其中停頓的 字形更尖銳,而 h 音字形 稍緩和。這兩個字形比較少強制使用,一般在排版過程中會被排版規則省略掉。但是如果需要直接討論音素或字母本身,或者應用在 cmevla 中,這兩個字形還是會被使用到的。

半元音 ɩ 和 ʊ 字形設計爲 ,與輔音和元音均不同,這是爲了與普通的輔音、元音區分開,表明它在形態學上的特殊地位。

元音字形在設計時,以立式爲例,首先每個元音均有一條豎線作爲主幹和基礎,然後,根據元音發音部位的不同,各字形和發音部位有一定的對應關係:

具體來說,就是前元音都是由一條主幹和若干橫線組成,後元音有兩條豎線,央元音只有 y 一個元音,爲 形,高元音特性爲於中央,低元音位於上方。
重音以元音末尾的鉤表示。

最後,考慮到書寫方便,每個字形在書寫時均能使用三個筆畫以內寫出,且笔画符合中文书写习惯,例如没有向左、向上的笔画。這些字形沒有強制規定的筆順,可以參照一般中文的習慣寫法。

構字株

構字株是由若干個部件按照一定排列規則組成的一個字,一般佔一個漢字大小。一個構字株由若干個構字部件組成,根據情況不同,一個株可以代表語音的一個音節,或者一個音素等。部件和株的關係基本上可類比於諺文的部件(字母)和音節的關係。「株」的概念不只適用於構字,它是一個通用的代表「大約一個漢字大小」完整字符的名稱。不同的組合方式可以用來表示不同的音節結構,且不同的組合方式也是用來適應不同的詞語類型,不同的形態學情況的。這些更高層的規則將會在後面章節中詳細介紹。本節將先枚舉常用的(規範的)的構字株組合結構,以及它們所代表的音節(音素序列),然後再敘述構字株組合和其代表音素系列的通用規則,可以涵蓋規範和不規範的任意合法組合形式。

下面表格每行爲一種構字株組合結構,每個結構圖示(「結構」列)中有若干個字母,每個字母代表一個部件,其整個株代表的音素序列如「代表」列所寫,每個字母的部件有一定的取值範圍,在「部件組成」列中列出。結構圖示中的字母如果加下劃線,該處部件若有立式臥式之分別,則寫作臥式,若無下劃線,則寫作立式。










名稱 結構 表示 部件組成
平株
A
A A: <VDCGh.>
泛單株
A
B
AB A: <CGh.>
B: <VD>
泛終株
A
C
B
ABC A: <CGh.>
B: <CGh.>
C: <VD>
泛間株
A
C
B
ABC A: <CGh.>
B: <VD>
C: <CGh.>
泛雙株
A
C
B
ABC A: <CGh.>
B: <VD>
C: <G>
疊幹株
A
B
A'B A: <VD>
B: <VD>
疊二株
A
C
B
AB'C A: <CGh.>
B: <VD>
C: <VD>
疊三株
A
C
B
D
AB'C'D A: <CGh.>
B: <VD>
C: <VD>
D: <VD>
疊(n)株
A
C
B
D
...
AB'C'D'... A: <CGh.>
B: <VD>
C: <VD>
D: <VD>
...
長終株
A
D
B
C
ABCD A: <CGh.>
B: <CGh.>
C: <VD>
D: <CGh.>
長間株
A
C
B
D
ABCD A: <CGh.>
B: <VD>
C: <CGh.>
D: <CGh.>
根終株
A
D
B
C
E
ABCDE A: <CGh.>
B: <CGh.>
C: <VD>
D: <CGh.>
E: <VD>
根間株
A
C
B
D
E
ABCDE A: <CGh.>
B: <VD>
C: <CGh.>
D: <CGh.>
E: <VD>

例如:gérku 可以寫爲 ,或者 等形式。djarspagéti 可以寫作

上表列出了規範的(常用的)構字株組合結構,這只是後面詞語範式和文本範式所會用到的一個子集。實際上,構字株的組合形式只要按照下面的規則,可被解析爲音素串,那就是合法的構字株。具體的規則爲:

定義一個構字株爲 1x1 漢字大小的部件組合體(也可以沒有,只由下標構成),再加若干個基線對齊(下標) 0.5x0.5 漢字大小的部件。其中 1x1 漢字大小的部件組合體,可以由 1x1, 1x0.5, 0.5x1, 0.5x0.5 這幾種大小的部件組合而成,且必須要填滿 1x1 大小的空間。後面加的基線對齊 0.5x0.5 漢字大小部件,可以有任意多個。

只由下標構成的構字株,黏附之前的株(例如意字株),就是說,如果之前株是由<VD>結尾的,且該株也是由<VD>開頭的,則該株與之前株的中間要添加一個 ' (h音)。

...

主體部分,不同的組合方式有不同的解析順序,而附加部分,每一個部件按照順序依次解析。主體部分所有的組合方式對應的解析順序如下表,部件的立式和臥式任意,不影響解析,含義相同。但加下劃線的字母,代表此處臥式是更自然的寫法,不加下劃線則立式是更自然的寫法:

結構 表示 部件組成
A
A A: <VDCGh.>
A
B
,
A
B
AB A: <VDCGh.>
B: <VDCGh.>
A
C
B
,
A
C
B
,
B
A
C
ABC A: <VDCGh.>
B: <VDCGh.>
C: <VDCGh.>
A
C
B
ABC A: <VDCGh.>
B: <VD>
C: <VDCGh.>
A
B
C
ABC A: <VDCGh.>
B: <VDCGh.>
C: <CGh.>
A
D
B
C
ABCD A: <VDCGh.>
B: <VDCGh.>
C: <VD>
D: <VDCGh.>
A
C
B
D
ABCD A: <VDCGh.>
B: <VDCGh.>
C: <VDCGh.>
D: <CGh.>

解析完成以後,生成一個音素序列,此時將連續的 <VD> 音素中間添加 ',即可得到該構字株所代表的音素串。

構字株組合結構設計原則

構字株的組合結構,在設計上考慮了視線的運動方向。夏理文是橫向書寫,先從左到右,再從上到下。

第一到三條是爲了無論使用什麼部件結合的方式,其視覺觀感順序大致一樣,和線性排列也類似,能給人一個如何排列部件的直覺。最後一條的原因是要處理長終株/根終株,在這個前提下,不想讓構幹出現在上方。

意字

意字是夏理文假借漢字來表示 lojban 詞語的部分,意字子系統通過組合漢字與意字葉、意字花,能夠用漢字表示 gismu, rafsi 等音素串。

這節會列出漢字、意字葉、意字花都有哪些,是如何書寫的。意字株是如何構成的,意字株如何對應音素串,如何解析。花林是如何構成的,花林如何對應因素串、如何解析。

漢字

漢字是一種語素文字,是由黃河流域文明華夏族發明的一種文字。在夏理文意字子系統中,一部分漢字被指定用來表示 lojban 的 gismu (或其他類型的詞語),以及這些詞語所對應的 rafsi。每個漢字對應一個詞語及其 rafsi,通過意字葉或意字花決定這個漢字代表的是詞語本身或若干個 rafsi 中的哪一個。

首先,lojban 中的每個 gismu 都對應一個(或若干個)漢字,組成意字表。lojban 本身的詞源中有中文,但是其質量不佳,因此夏理文選擇考慮漢字的歷史含義和當前含義,爲每一個 gismu 都指派一個漢字,形成意字表。目前這項工作還未完成,完成後將會發佈在此文檔中。現在我們可以假設每個 gismu 均有一個對應的漢字,本文用到的例子,其臨時指派的意字表會寫到旁邊。此外,根據每個人具體使用目的的不同,實際使用中也可以指派漢字對應其他類型的詞,如 cmavo,zi'evla 等。但是一個漢字作爲基本單位,只能對應一個詞(及其 rafsi)。對這些應用場景,在後面也會詳細解釋。

總之,一部分漢字被假借,每個漢字對應一個詞語(主要爲 gismu)和若干個 rafsi。

漢字在書寫時與一個構字株(無附加部分)大小相同,與構字株基線對齊。

意字葉

意字葉是用來標記漢字所表示的音素串具體是哪個的,一個漢字本身有歧義性,可能對應一個詞本身或其任意一個 rafsi,而意字葉就是用來指定漢字具體對應的是哪個形式。lojban 中的詞語對應的 rafsi 有 CCV, CVC, CVG(=CD), CV'V, CVCC, CCVC 幾種形式的,對 gismu 來說,前四種形式還可以有兩種對應原詞音素的關係(同一個形式的 rafsi 可以來自兩種不同的 rafsi 備選形式,例如 gismu 爲 CVCCV 時,CVC 可取自第 1,2,3 音素或 1,2,4 音素)。

每種 rafsi 形式,以及詞語本身,都有一個對應的意字葉代表這種形式。且表示每個形式的意字葉還有重音變體,用來標記其中的某個元音爲重音。所有意字葉的字形如下表:

名稱 字形 頂標形式 上標形式 表示 對應構字形式
終葉 CCV̀ 泛終株
重音終葉 CC 泛終株
間葉 CV̀C 泛間株
重音間葉 CC 泛間株
雙葉 CV̀G 泛雙株
重音雙葉 CG 泛雙株
疊葉 CV̀'V̀ 疊二株
前重音疊葉 C'V̀ 疊二株
後重音疊葉 CV̀' 疊二株
全重音疊葉 C' 疊二株
長葉 CV̀CC/CV̀CC 長終株/長間株
重音長葉 CCC/CCC 長終株/長間株
本葉 CCV̀CV̀/CV̀CCV̀/0 -
前重音本葉 = -
後重音本葉 CCV̀C/CV̀CC/2 -
全重音本葉 CCC/CCC/3 -
前重音空葉 任意形式1 -
後重音空葉 任意形式2 -
全重音空葉 任意形式3 -

0: 如果這個漢字對應的詞語是非 gismu 的 brivla 或 cmavo,則原形式所有<VD\y>均爲非重音;是 cmevla,則按照對應 cmevla 自帶的重音形式。
1: 非 gismu 的詞,則原形式倒數第二個<VD\y>爲重音,其餘爲非重音,如果不滿兩個,則唯一一個爲重音。
2: 非 gismu 的詞,則原形式最後一個<VD\y>爲重音,其餘爲非重音。
3: 非 gismu 的詞,則原形式每個<VD\y>均爲重音。

終葉、間葉、雙葉、疊葉這四種對應 short rafsi 的意字葉有兩種形式,如果該 rafsi 來自 gismu 的字母靠前,則使用第一種形式,否則使用第二種形式。如果該 rafsi 不來自 gismu,則使用第一種形式。這樣對 gismu 來說不使用 rafsi 詞典就可以直接確定意字株對應的音素串,具體爲:

rafsi 形式 gismu 字母順序 gismu 形式 意字葉形式
CCV 123 CCVCV(終) 第一終葉
CCV 132 CVCCV(間) 第一終葉
CCV 345 CVCCV(間) 第二終葉
CVC 134 CCVCV(終) 第一間葉
CVC 234 CCVCV(終) 第二間葉
CVC 123 CVCCV(間) 第一間葉
CVC 124 CVCCV(間) 第二間葉
CVG 135 CCVCV(終) 第一雙葉
CVG 235 CCVCV(終) 第二雙葉
CVG 125 CVCCV(間) 第一雙葉
CV'V 13'5 CCVCV(終) 第一疊葉
CV'V 23'5 CCVCV(終) 第二疊葉
CV'V 12'5 CVCCV(間) 第一疊葉

意字葉字形設計原則

意字葉的字形首先要儘量與構字部件不同,其次要好寫,在兩筆之內就能寫出。其次,一個詞的 rafsi 根據長度來分,主要分成兩種,一種是三個字母的 short rafsi,一種是四個字母的 long rafsi。我們選擇使用 字形的旋轉變體來表示不同的 short rafsi 形式,並選擇 來表示 long rafsi,因爲後者是一條直線,帶有「長」的隱含含義。最後,我們使用一個圓圈表示詞語本身(可以省略,具體見後文中「意字株」一節)。

的旋轉(包括對稱)變體有8種,但我們只需要尖尖朝向四個基準方向的4種變體即可。考慮到符合漢字書寫習慣和一致性,我們選擇折畫方向時,總是選擇向右 或向下 ,而由折畫起筆時,總是在上方 或左方 起筆。short rafsi 剛好有四種可能的形式,分別對應上述四種旋轉變體。具體哪種是大致根據其重音標記方向對應構字株結構的形狀來決定的。例如,重音終葉的重音標記位於右側,對應泛終株的元音在右側,所以終葉的字形就選擇豎的字形,其餘也是類似的選擇。short rafsi 的兩種形式,後一種形式是將尖尖加一個彎折,手寫體也可以將尖尖和彎折寫成弧線。長葉是一條短豎線,和意字花的橫線連接符不衝突。

意字株

意字株由一個漢字和一個意字葉構成,用來表示漢字所對應的一個音素串。意字葉分爲頂標形式和上標形式兩種。兩種使用上是一樣的,可以隨意選擇適合的形式。一般來說,規範的形式是頂標形式,而上標形式是一種備選。意字株表示的音素串,是在漢字對應的衆多音素串中,選擇意字葉對應的那種形態的那一個。

漢字對應詞語形態屬於 gismu 時,本葉對應 gismu 本身,其他葉相應對應各形態 rafsi。
屬於 cmavo 時,本葉對應 cmavo 本身,rafsi 用對應形態的意字葉,兩種變體總是使用第一種。
屬於 lujvo 時,本葉對應 lujvo 本身,長葉對應其輔音結尾的 cmevla 形式。因爲其包含多個 rafsi,一個意字葉無法覆蓋所有情況。這個時候可以疊加使用多個意字葉,中標依次從左到右表示其中各 rafsi 狀態。上標則依次向右順延,後方文本讓位,從最後一個意字葉右側繼續。如果存在 lujvo 對應單個 short rafsi 的情況,則使用單個意字葉。
屬於 zi'evla 時,本葉對應 zi'evla 本身,長葉對應去除最終元音後的部分。若有 rafsi,則使用相應意字葉。
屬於 cmevla 時,只有本葉可以使用。這個時候它內涵有重音,而不是使用意字葉指定重音。

頂標形式:,上標形式:

上標形式的下方小角空間還可以寫下標構字株。例如 si'ercárvi /

意字葉也可以被省略,如果沒有意字葉,(在該字不屬於花林時)則獨立成詞。具體來說,該漢字對應的詞語形態屬於 brivla 時,則等同於前重音本葉;當該漢字對應的詞語形態屬於 cmavo 時,則等同於本葉;當該漢字對應的詞語形態屬於 cmevla 時,則等同於本葉,同時詞語兩側添加中斷。

例如:我們假設「雪」這個漢字對應 snime 這個詞語,它有 rafsi: si'e, snim。則省略意字葉單獨出現的「」=「」=「」=「」對應 sníme,而「」就對應sí'e。如果我們用「暴」對應 vlile (rafsi: vil, vlil),則 vilsi'e 可被寫作 「」。

意字株並不限於只能用作 gismu,lujvo,甚至不限於用作符合詞源的地方。cmevla,zi'evla 裡面都可以用,甚至本來詞源不是這個詞,也可以用,只要音素串一致。假設「羊」代表 lanme,「犬」代表 gerku 例如我的名字 la .lánger. 就可以寫作 。甚至詞源無關的 zi'evla 也可以硬寫,例如我剛剛在詞典搜到 nunrlanparti 這個 zi'evla 含義大致是 「x1 是人群 x2 參與的局域網聚會,在 x3 地點舉辦,人們都來自 x4 地點」,我們假設「爬」代表 cpare,擁有 rafsi "par",這個詞 nunrlanpárti 也可以被寫作「」。

還有三個特殊的意字葉,「前重音空葉」、「後重音空葉」和「全重音空葉」。這三個空葉使用的話,等同於意字葉省略的情況,但額外標記了重音。這個適合在花林中使用,或者在 cmevla 中使用。

意字花

意字花是用來省略常用形式複合詞(lujvo 或 rafsi 組成的 cmevla)形式音素串中多個連續漢字的意字葉使用的,各意字花的名稱和字形爲:

名稱 字形 頂標形式 中標形式 表示
短花 最優元音結尾形式,倒數第二個<VD\y>爲重音
續短花 最優元音結尾形式,無重音
長花 未簡化元音結尾形式,倒數第二個<VD\y>爲重音
續長花 未簡化元音結尾形式,無重音
短名花 最優輔音結尾形式,倒數第二個<VD\y>爲重音
續短名花 最優輔音結尾形式,無重音
長名花 未簡化輔音結尾形式,倒數第二個<VD\y>爲重音
續長名花 未簡化輔音結尾形式,無重音

意字花也類似意字葉有兩種形式:頂標形式和中標形式。頂標形式搭配意字葉的頂標形式,需要配合上劃線使用。中標形式搭配意字葉的上標形式,需要配合中劃線使用。

花林

花林是一種涵蓋多個意字株(也可以包含構字株)的結構,用來給最優類 lujvo 形式或未簡化類 lujvo 形式下的意字株省略意字葉,適合在 lujvo 或 rafsi 組合出的 cmevla 中使用,使意字株的書寫更簡潔。花林由意字花、連接線和意字株(或構字株)組成,其中的每一株對應一個 rafsi,結構形如:

頂標花林:012345

中標花林:012345

0: 起始株,頂標花林的話右半上劃線
1: 單獨出現的漢字,作爲沒有意字葉的意字株,在花林中作爲整體的一部分考慮,其形式受意字花指定。頂標的上劃線貫穿
2: 有非空意字葉的意字株,表示意字葉指定的形式,頂標的情況下,上劃線給意字葉讓步(但點形式的重音空葉,疊加書寫),中標的情況下,中劃線和意字葉共存
3: 有標重音的意字株,形式仍然未定,受意字花指定
4: 除漢字外,構字株也可以出現在花林內,必須表示一個或若干個 rafsi,其表示形式爲自身
5: 結束株,頂標花林左側上標標記意字花,右側留給結束株的意字株。中標形式若要標記意字葉,則先寫中劃線,其上標記意字葉,然後再寫意字花。中標形式當意字花是短花時,不寫出。

一個花林具體表示什麼音素串,首先由其中形式確定的 rafsi,包括有非空意字葉的意字株、構字株這些,施加限制條件,然後看意字花,如果意字花指定的是未簡化形式,則剩餘未確定形式的株,全部視作 long rafsi 形式,最後一個詞視作 gismu 形式。如果意字花指定的是最優形式,則其餘 rafsi 對應的是最優 lujvo 形式中這些 rafsi 的形式。rafsi 間的連字符一般是不明確寫出來的,而是未簡化形式或最優形式複合詞其中蘊含的,如果要寫的話必須使用下標形式(如果是中標花林,則連字符要寫在中劃線下方,上標花林直接寫出即可),使其和 rafsi 有區分。擴展語法下,如果有的 rafsi 比較長,構字株中包含下標小字,且又用的是上標花林,那就被看作不能區分的 rafsi,在其邊界處添加一對中劃線,將其括成一個整體。

與意字葉類似,花林不一樣非要表示一個單獨的詞語,它也可以表示詞語的一部分,只要音素串一致。但是一般不表示多個詞語,可以使用重音標記在內部分隔詞語,但這樣會帶來一定的理解困難。重音標記和花林的計算是獨立的,不涉及形式上的限制條件,所以非要表示多個詞語,只要音素串形式允許,那也是可以的。

這個實現假設你使用的 lojban 方言有一個確定性的 lujvo/複合 cmevla 枚舉和評分算法,以及 lujvo/複合 cmevla 解析算法,當然這個算法也不一定非要是官方的,lojban 在近些時間有人對什麼是 rafsi,還有什麼連字符是允許的,這些問題有各種不同的意見,還有語法上的擴展(例如latkerlo-jvotci 这个实现)。如果這些擴展允許現有詞語新形態的 rafsi,則你可以添加新的意字葉形式。如果這些擴展允許新的連字符,只用意字葉時本來就要顯式寫出,並不會影響使用,而用意字花時,我們又是從 rafsi 出發,一般是忽略連字符的,使用什麼連字符是算法中決定的,因此也不影響使用。如果這些擴展允許不定形態的 rafsi(例如 zi'evla),則可以使用構字株寫出,或者如果它有假借漢字,則也可以用意字株寫出,爲了區分 rafsi 邊界,中標花林有中劃線本身就可以區分,而上標花林中,需要在不能區分的 rafsi 邊界處添加一對中劃線。

一些花林的例字(漢字爲臨時指定):

si'erćarvi: (snime + carvi)
si'erjoijaucarvi: (snime + joi + djacu + carvi)
snimyjoidjacycarvi:
lolro'iboi: (loldi + rokci + bolci)
sivypo'eci'e: (sivni + ponse + ciste, 資本主義, 花林中不一定都要用意字,也可以用構字,且重音不寫也可以被花林加上)

bonboíbar: (boxna + bolci + bartu,名字形式)
bonbolbár: (boxna + bolci + bartu,名字形式,使用意字葉限定 bolci 的 rafsi 形式,標記重音)
bárbolbon: (bartu + bolci + boxna,名字形式)

seltcanrjungoliiantónu: (se + tcana 開頭的 zi'evla,構詞形式只是一種可能性,意思可能爲「中國聯通的網絡」)

xanyuídje:

訓字株(林)

訓字株(林)是假借漢字、漢字詞或其他文字的字詞,表示任意指定的音素串的一種結構。訓字株是在文本中佔一個漢字、一個株大小的結構,而訓字林是多個漢字、佔多個株大小的一個整體結構。

訓字株分爲頂標和上標,頂標訓字株的結構是:A(B...)
上標訓字株的結構是:AB...
其中,A 是任意漢字,被假借,而 B 爲該漢字實際表示的內容。這個結構整體表示的是 B 代表的內容。頂標形式下,B 的字號稍小,可以包含任意的夏理文文本,如果 B 的長度較長,則要往 A 的右側延伸,並佔據行內空間,後面的株在其結束位置繼續書寫。例如
A(B)C

頂標和上標作用是一樣的,可以自由選用。訓字株的使用例如:

ma'arbúmru: loma'arbúmrucubrífe

la cínjudútcyngxuʊangmíɩa̮m

訓字林是假借多個漢字用來表示任意指定的音素串的結構,相比於訓字株,它可以使用多個漢字,漢字詞語等,可將其視爲一個整體假借。其形式爲:

頂標訓字林:A(B...)
上標訓字林:AB...

其中,A 是任意字詞,被假借,B 爲實際表示的內容。其他與訓字株類似。使用例如:

十全十美 - múlno

大觀園市場 - la dagúʊániʊánzarc

織田 信長 - ódas nobúnágás

組詞規則

組詞規則就是在表示各種詞語的時候,要怎麼組織各種類型的株。夏理文是從左到右、從上到下書寫的,各株之間默認沒有間距,空格表示停頓(文本規則會在後面「素文」一節敘述)。夏理文在解析文本時,事實上只要按照各株解析出的音素串和要表達的音素串一致,就是合法的表示。但是爲了讓夏理文文本遵循一定風格,讓它讀起來更容易,我們規定了幾種詞語範式。這些詞語範式,後面的文本範式中也會使用。應用詞語範式和文本範式的話,一段音素串可以確定性地編排出唯一的夏理文表示。

下面依次有若干個範式,這些範式是並行的,沒有特定的依賴關係。

下面將會使用這個句子中的詞語作爲各種範式的示例:

lǫ sodvrkokakóla cu mo'i ni'a fárlu le boltípyboɩ le ti me la .títsnim. me'u bótpi

平詞範式

平詞範式適用於所有類型的詞語(gismu, lujvo, zi'evla, cmavo, cmevla),它就是把所有的音素,每個都按順序用構字株平株寫出。

例如:
lǫ:
sodvrkokakóla:
mo'i:
fárlu:
boltípyboɩ:
títsnim:

泛詞範式

泛詞範式適用於所有類型的詞語,「泛」取「廣泛適用」之意。泛詞範式致力於將詞語的每個音節寫成一個構字株,泛詞範式依特定方式將詞語的音素串序列分爲若干個「泛音節」,將每一個泛音節用一個構字株寫出。這裡爲了方便,使用 C 代表 <CG.>,V 代表 <VD>,V... 代表任意多個 V 中間由 ' 分隔。

泛音節劃分方式爲:

  1. 尋找詞語中所有的 CCV...,其中 CC 符合 <C><S> 或是起始輔音對,這樣的片段標記爲泛音節
  2. 在剩下的片段中,尋找所有 CVC 片段,且之後不是V,這樣的片段標記爲泛音節
  3. 在剩下的片段中,尋找所有 CV...片段,標記爲泛音節
  4. 剩下的每個音素,均爲一個泛音節

這樣劃分完成以後,第1步的結果可以用泛終株(多個元音可以往後加下標構幹)表示,第2步結果可以用泛間株表示,第3步結果可以用泛單株、疊n株表示。第4步結果可以用平株表示,這樣一個株就代表一個泛音節。

例如:
lǫ:
sodvrkokakóla:
mo'i:
fárlu:
boltípyboɩ:
títsnim:

複構詞範式

複構詞範式適用於 gismu,lujvo, rafsi fu'ivla 和 rafsi cmevla,致力於讓每個 rafsi 都對應一個構字株。

對 gismu, lujvo 來說,每個 rafsi (包括詞語結尾處 gismu,zi'evla)都對應一個構字株。rafsi 之間的連字符,作爲下標黏附於上一個 rafsi 之後。各種形式的 rafsi 對應構字株爲:

zi'evla rafsi 第一個音素作爲株的主體部分,其他音素都寫成下標部分。

詞語結尾處,gismu 寫作根終株或根間株形式,而 zi'evla 與 zi'evla rafsi 寫的方式相同,第一個音素作爲主體,其他音素寫成下標。

對 rafsi fu'ivla 來說,前面的 rafsi 部分按照上面的 rafsi 方式寫作一個株(如果有擴展語法允許前面有更多 rafsi,則規則與 lujvo 類似),連字符在其後面粘附寫作下標。後面的任意形式部分把所有音素按照順序用平株寫出。

例如:
sodvrkokakóla:
fárlu:
boltípyboɩ:
títsnim:

複葉詞範式

複葉詞範式適用範圍和複構詞範式是一樣的,它也是和複構詞範式類似的。它致力於讓每個 rafsi 都對應一個意字株。沒有意字對應的使用構字株。它基本上和複構詞範式是類似的,但是各種形態的 rafsi 對應意字株,如下:

zi'evla rafsi 如果有漢字對應,則視情況省略意字葉或添加長葉。

連字符寫成下標形式,黏附於上一株。詞語結尾處,gismu 的意字葉省略,因爲 lujvo 結尾如果是 gismu,則一定是倒數第二個<VD\y>重音,可以省略意字葉。結尾如果是 zi'evla,如果有對應漢字,則也當 gismu 一樣用一個漢字表示,否則使用與複構詞範式一樣的寫法。

rafsi fu'ivla 也類似,不再贅述。

例如:
sodvrkokakóla:
fárlu:
boltípyboɩ:
títsnim:

複花詞範式

複花詞範式適用於 lujvo,rafsi cmevla 和多個 rafsi 組成的 rafsi fu'ivla,其致力於用一個花林來表示 lujvo,用儘量少的意字葉。

首先,將原詞的各個 rafsi (包括結尾處 gismu 或 zi'evla)分開,然後考察兩個備選方案,其一是使用短(名)花,其二是使用長(名)花。

先將原詞 rafsi 對應成漢字,如果沒有對應漢字,則使用平株寫出 rafsi。然後將漢字和平株連在一起,中間用中劃線隔開,以區分平株的邊界。然後,寫下上標花林的上劃線和意字花,得到初始的花林形式。分別給兩種花林中與原形式不同的 rafsi 標上意字葉,比較比較這兩個候選花林哪個意字葉更少,選擇更少的,如果一樣多則選擇短(名)花林。選擇出來以後,再標記重音。按照原詞的重音(這裡主要是 rafsi cmevla)先確定倒數第二個<VD\y>是否爲重音,然後對應選擇意字花的「續」變體。最後,再標記其他音節的重音,如果有意字葉則修改對應意字葉。如果沒有意字葉,使用點形式的重音空葉,如果音節只有一個<VD\y>,則使用後重音空葉。

如果詞語已經是最優形式,或者是未簡化形式,且沒有特別的重音,則不需要標記任何意字葉,只需要意字花即可。

例如:
boltípyboɩ:
títsnim:

多個 rafsi 組成的 rafsi fu'ivla,後面的部分同複葉詞範式。

素文

素文是沒有標點的夏理文文本,能和要表達的原文之間有比較好的對應關係,且較少或不會引入與音素串無關的額外信息。素文包括幾種範式,使用這幾種範式能通過夏理 Latin 正字法確定性地編排出唯一對應的夏理文文本。下面的幾種範式,其結構是依次變得更複雜的,邏輯上來說,後一個也是可以由前一個依次構造出來的。就使用上來說,這些範式使用哪一個,或者使用與否,是使用者的自由,不引入意字的情況下,構文範式是比較好的寫法。在引入意字的情況下,花文範式是一般比較好的寫法。

平文範式 泛文範式 構文範式 葉文範式 花文範式
gismu 平詞範式 泛詞範式 泛詞範式 複葉詞範式 複葉詞範式
lujvo 平詞範式 泛詞範式 複構詞範式 複葉詞範式 複花詞範式
rafsi fu'ivla 平詞範式 泛詞範式 複構詞範式 複葉詞範式 複葉詞範式
其他 zi'evla 平詞範式 平詞範式 平詞範式 平詞範式 平詞範式
cmavo 平詞範式 泛詞範式 泛詞範式 泛詞範式 泛詞範式
cmevla 平詞範式 平詞範式 平詞範式 平詞範式 平詞範式

下面將會使用這個句子中的詞語作爲各種範式的示例:

lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

平文範式

平文範式就是所有詞語都用平詞範式,Latin 正字法的片段之間使用空格分隔,如果 Latin 正字法兩個詞語之間沒有空格(而是被分詞算法隱式分隔),其對應的平文範式也不加空格,空格只反映原文,不反映詞語邊界。

示例:lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

泛文範式

泛文範式就是 cmevla 和 zi'evla(包括 rafsi fu'ivla)都使用平詞範式,gismu, lujvo 和 cmvao 用泛詞範式。片段之間使用空格分隔。

示例:lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

構文範式

構文範式就是 cmevla 和 rafsi fu'ivla 以外的 zi'evla 都使用平詞範式,gismu 和 cmavo 用泛詞範式,lujvo 和 rafsi fu'ivla 用複構詞範式。片段之間使用空格分隔。

示例:lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

葉文範式

葉文範式就是在構文範式的基礎上,gismu, lujvo 和 rafsi fu'ivla 都使用複葉詞範式。片段之間使用空格分隔。

示例:lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

花文範式

花文範式就是在葉文範式的基礎上,lujvo 和 rafsi fu'ivla 都使用複花詞範式。片段之間使用空格分隔。

示例:lǫ sodvrkokakóla cu mo'ini'a fárlu le boltípyboɩ le ti mela títsnim me'u bótpi

標點

標點是用來用來補充一些素文沒有的特性的。

標點系統可以按照需求任意使用,沒有特定的規範,只有推薦的用法,標點除了部分標點能代替空格外,不影響解析結果。

普通標點包括句讀點、層次號、項目號、引號括號、下劃線幾類。句讀點在解析時,等同於空格。其他幾類普通標點不影響解析結果。每個符號的名稱、字形、作用、使用示例如下表:

類別 名稱 字形 作用 使用示例
句讀點 標記必須要中斷的地方
= 頓點 標記一個句子內部含義需要中斷的地方,例如並列的結構
= 讀點 標記兩個關係密切的句子的邊界,如轉折句
= 句點 標記幾個關係密切的句子的結束
層次號 卷號 標記最大的文本層次結構(卷)的開始
= 篇號 標記次大的文本層次結構(篇)的開始
= 章號 標記中等的文本層次結構(章)的開始
= 節號 標記次小的文本層次結構(節)的開始
= 段號 標記最小的文本層次結構(段)的開始
項目號 條目號 標記一級層次的項目(條)
= 點目號 標記二級層次的項目(點)
= 項號 標記三級層次的項目(項)
= 目號 標記四級層次的項目(目)
引號括號 引號 標記被引用的文本,對象文本
= 雙引號 與引號作用相同,嵌套可以交替使用
= 括號 標記注釋文本,元文本
= 雙括號 與括號作用相同,嵌套可以交替使用
下劃線 下劃線 用來標記文本
= 雙下劃線 用來標記文本
= 底標點 用來標記文本
= 空底標點 用來標記文本

韻符

韻符用來表示素文不能表示的語音特性。如下表:

名稱 字形 作用 使用示例
高調號 表示較高的聲調(振動頻率)
低調號 表示較低的聲調
升調號 表示上升的聲調
降調號 表示下降的聲調
峰調號 表示先上升、再下降的聲調
谷調號 表示先下降、再上升的聲調
強音號 表示音量(振幅)較大
弱音號 表示音量(振幅)較小
長音號 表示聲音持續時間較長
短音號 表示聲音持續時間較短
緊音號 表示聲音較緊張(諧波及噪聲能量大)
鬆音號 表示聲音較舒緩(諧波及噪聲能量小)

夏理文

自上而下的解讀

把一個漢字的空間叫作全角,二分之一空間叫作半角,四分之一空間叫作小角,「角」指小角,因此,一個全角有四個角,一個半角有兩個角。

半角分爲:左/右半角、上/下半角;(小)角分爲:左上/右上/左下/右下(小)角

全角: F,半角: H, 小角: C, 左右上下:4682

示例字體字形實例命名:
<字母名稱-重音><位置>
其中位置包括 4682 和 7193。4682 是半角字符,7193 是小角字符,分別對應左上、左下、右上、右下的横寫式,横寫式則前面加0

SVG 插件测试

这是一个普通的段落。

我想要在这里插入一个爱心:

列表测试

夏理文可以和混排
夏理文蓝色可以和中文混排

最好

通用 .i do mi prami .i mi do prami .i la .micuueBIN.tcyn. titla melbi
夏理 idomiprámi imidoprámi ila.micuʊebín.tcyn.títlamélbi
夏理 i do mi prámi i mi do prámi i la.micuʊébin.tcyn.títla mélbi



通用 do dicra .e'a mi ca la .daucac. bi'onai la .gaicac.
夏理 do dícra e'a mi ca la dá̮cac bi'oną la gą́cac

通用 loi sodvrkokakola cu mo'i farlu le boltipyboi le ti botpi
夏理 lǫ sodvrkokakóla cu mo'i fárlu le boltípyboɩ le ti bótpi

你好


H1
1
3
2


有4種形式,unreduced lujvo, 最優 lujvo,unreduced cmevla, 最優 cmevla。還有重音形式/非重音形式




宏系统测试

  1. 状态记录测试

  2. 嵌套花括号测试

    这里面有嵌套的花括号 { 就像这样 } 依然可以正常解析

  3. HTML 与 MD 输出测试

这是普通文字。


田字格模板

runmenlrdjeminai