人工言語学 Wiki

管理の都合により、このWikiはまもなく廃止される予定です。移行先などの詳細は現在協議中です。

もっと見る

人工言語学 Wiki
登録
Advertisement
CLaKIS標準 :  BERN CC1
CLAコード
CLA v1 番号 CLaKIS CC2015-1
提案日 2015/7/21
発行日 2015/7/21
執筆者 おかゆ, Yuhr
CLA v2 番号 CLaKIS CC2021-1
提案日 2021/8/5
発行日 2021/8/5
執筆者 佐藤陽花
CLA v1
CLA v2
仕様書 CL-KIITA/CLACode_SRI
  :spec/cla_old.md
CLA v3 番号 CLaKIS CC2021-2
CLaKIS CC2021-3
CLaKIS CC2021-4
CLaKIS CC2021-5
提案日 2021/8/17
発行日 2021/9/2
(SD: 未発行)
執筆者 佐藤陽花, Ziphil,
フルヒト, Xirdim,
AI, ѕkytomo
仕様書 CL-KIITA/CLACode_SRI
  :spec/cla_code.md


CLA (ConLAng) コードとは、ISO 639 に倣い、各人工言語のコードを規定するものである。 このコードを用いることで、辞典データなどのデータベース上で人工言語を取り扱いやすくなる。

初版 (CLA v1) は 2015 年 7 月 21 日におかゆ氏により提案され、それ以降 Google Form を利用して申請および承認がなされていた。(改訂に伴い申請受付が停止された。ただし既に承認されたコードは現在も有効)。

この状況を受け、佐藤陽花氏による私案 (後述) をもとに、佐藤陽花氏, Ziphil 氏, Xirdim 氏, フルヒト氏を始めとするメンバーによって、第 3 版 (CLA v3) が考案された。

2021 年 8 月 31 日には、CLA v3 のコードを申請および一覧できるサイト Conlang Portal がオープンし、また、2021 年 9 月 2 日には CLA v3 仕様書が発行された。

CLA v1[]

概要[]

CLA コードは 3 文字および 5 文字の ASCII ラテン小文字で規定される。 初めの 3 文字はその言語に割り当てられたコードを表し、後ろの 2 文字は (存在すれば) その言語の属する人工言語語族 (世界や作者などによる暫定的な分類) に割り当てられたコードを表す。 特に重複などの無い限りは、3 文字のみで表記することができる。

ある言語のコードを決定する際には、その言語名をその言語によって綴ったものをさらにラテン小文字転写したものをもとに、重複のないよう決定する。

申請[]

以下の Google Form により申請できた。

https://docs.google.com/forms/d/1hIGV5PnCTZZIABk6K2pomHGfjLW8aL5cvNfYlPxS338/viewform

懸念[]

  • ISO コードとの衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
  • 略号の競合で喧嘩が起こる可能性がある。
  • 開発中止となった人工言語の CLA コードの処理をどうするか。
  • 語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。ひとつの救済策として「無所属/未定コード」を用意する方法がある。「**」をそれとすることで、そのような言語の申請のハードルを下げられるかもしれない。もちろん、「**」はもっとも広い語族となりうるため、その中で言語コードの衝突が起こる可能性も他に比べて高くなる。そのため、「**」語族の言語は、衝突が起こりうる際、委員会から語族コードの決定要請がなされる(この救済策は草稿段階である)。

一覧[]

ver 0.6 (2015/07/22)[]

順番は申請順。

言語名 CLA言語コード CLA語族コード
シャレイア語 (qixaléh) xal zp
ロジバン (lojban) jbo lg
クレリカ (qreriqa) qre hr
アルテナ語 (altenam qeras) alt ll
シヴァン (xivan) xiv am
アルカ (arka) ark rx
(三代目)リパライン語 (lineparine) lpa lp
ヴェフィス語(四代目リパライン語) (Vaifise) vef lp

ver 0.7 (2015/07/25)[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
ワコファル語 (wakofal syal) wkf ll
モヤシ語 (kistel) [ver 0.9 にて改定] ktl mc
イジェール語 (Etube Id'erin) idz id
トキポナ (toki Pona) tpn **

ver 0.8 (2015/08/13)[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
カルコレーシュ語 (Calcoradetár) cal ca

ver 0.9 (2016/01/17)[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
凪霧(nagili) alt rx
ヴォルヘモ(Volxemo [ver 0.95 にて改定] vlm vl
モヤシ語(moiacis) mic mc
レテシミ語(letesimi) lsm mc

ver 0.95 (2016/10/12)[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
ビウ語(biwe) biw vl
ヴォレモ(Volxemo) vlm vl

ver 2017-11-13[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
フィダーヌス語(Fidánasa Uduhos) [ver 2021-08-03にて改定] fid ut
レクステンス(lekustens) lst ls

ver 2021-08-03[]

順番は申請順。 新たに追加されたコードだけを掲載する。

言語名 CLA言語コード CLA語族コード
フィダーヌス語(Heb Fidana) fid ht
ミ・デア語(Żea Mi-Dea) nkl md
アポート語(uptohgikulecsepi) upt ni
デーレ語(aulakk derle) del et
ボウニム語(bohnimik) bnm xr
オ゛ェジュルニョェーッ語(Ƣeznē'bix) fez fb

CLA v2[]

CLA v1 に対する上記の懸念を解決するため、オ゛ェジュルニョェーッ語の創作を率いる佐藤陽花氏により提案された私案である。なお運用には至っていない(ただし例示としてオ゛ェジュルニョェーッ語にのみコードが付与されている(fez/fb))。


開発中止となった人工言語の CLA コードの処理[]

ISO コードにおける消滅言語の取扱いに倣い、存属する。

略号の競合で喧嘩が起こる可能性[]

各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。

「無所属/未定コード」の処理[]

上記常設委員会の設立のほか、「無所属/未定コード」に関連する以下のような CLA コードのコード定義の変更を行う。

  • 語族領域 ... それぞれの言語(群)ごとの設定や世界観に伴った語族によってコードを付与するための領域。/をプレフィックスとし、ASCII ラテン小文字 2 字の語族コードが充てられる。
  • 製作者領域 ... 語族別ではなく、製作者/製作団体のコード附与を希望する製作者/製作団体に付与するための領域。~ をプレフィックスとし、ASCII ラテン小文字 2 字の製作者コードが充てられる。
  • 無所属領域 ... 語族領域にも製作者領域にも属さないことを希望した言語のための領域。#** が充てられる。
  • 未定領域 ... どのコード付与を希望するか未だ決まっていない言語のためのための領域。?** が充てられる。

CLA v3[]

概要[]

上記の CLA v1 の問題を受け、新たに制定された CLA コードである。 Conlang Portal で管理されている。

CLA v3 は、以下の 4 階層構成になっている。

  • 製作者コード (3 桁) … 製作者や製作団体を表す階層。
  • 語族コード (3 桁) … 同一の製作者や製作団体が作る複数の言語をグループ化するための階層。世界観や語族などが相当する。
  • 言語コード (2 桁) … 言語を表す階層。
  • 方言コード (2 桁) … 言語に方言変種がある場合に、その方言を表す階層。

コードを表記する際は、これらを逆順に _ で繋げて表記する。 例えば、製作者コードが ccc, 語族コードが fff, 言語コードが ll, 方言コードが dd であれば、コード全体は dd_ll_fff_ccc となる。

語族コードと方言コードは指定しないことが可能で、その場合は ~ で表す。

言語コード体系識別コード[]

CLaKIS標準 :  BERN CC2
言語コード体系識別コード
番号 CLaKIS CC2021-6
提案日 2021/8/17
発行日 2021/9/2
執筆者 佐藤陽花
仕様書 CL-KIITA/CLACode_SRI
  :spec/sys_disc.md

注意全ての言語コードの完全上位概念であるので、原則としてマッピングすることはできない。

言語コードをデータ記述ファイルやプログラム上に記載するとき、或いは文書上で表記するときにどの言語コード体系に準拠して記載されているかを示し、判別するための 4 字コード。書式は[a-z]{3}[a-z0-9]であり、主なものは次の通り。

  • iso1  自然言語:ISO639-1
  • iso2  自然言語:ISO639-2
  • iso3  自然言語:ISO639-3
  • cla1  人工言語:CLA コード、従来版
  • cla2  人工言語:CLA コード、私案版
  • cla3  人工言語:CLA コード、正規改訂版
  • glot  自然言語:Glottolog
  • ietf  自然言語:IETF 言語タグ
  • lisr  自然言語:Lingasphere Register
  • verb  人工言語:Verbix

システムでどのコード体系のどの版を受け入れるかは個別のシステムごとに指定される

推奨は iso1,iso3,cla1,cla3 の 4 種

記法[]

各種言語コードとともに記載する場合は、プリフィックスとして言語コードに前置し、一つのコードとして扱う。この場合、余分な空白等は加えず、また識別コードを{ }で囲う。

  • ex1) {cla3}~_fz_fzb_brl: CLA コード改訂版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード
  • ex2) {cla1}fez_fb: CLA コード従来版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード
  • ex3) {cla2}fez/fb: CLA コード私案版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード

懸念解決の実際[]

CLA v1 に対する上記の懸念は、CLA v3の制定時に次のように解決された(CLA v2における提案を基にしたものである)。

ISO コードとの関係について[]

  • 懸念:ISO コードとの衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
  • v2提案:なし

言語コード体系識別コードの制定により解決された。

開発中止となった人工言語の CLA コードの処理[]

  • 懸念:開発中止となった人工言語の CLA コードの処理をどうするか。
  • v2提案:ISO コードにおける消滅言語の取扱いに倣い、存属する。

v2提案が変更なく採用されたことにより解決された。

略号の競合で喧嘩が起こる可能性[]

  • 懸念:略号の競合で喧嘩が起こる可能性がある。
  • v2提案:各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。

CLA コードを管理する組織は、提案による常設委員会でなく、SCJ傘下の情報関連事業部門であるCL-KIITAのCLA コード部門となった。CL-KIITAの機構・システムにより解決された。

「無所属/未定コード」の処理[]

  • 懸念:語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。
  • v2提案:上記常設委員会の設立のほか、「無所属/未定コード」に関連する CLA コードのコード定義の変更を行う。

CLA v3に記載された通りコード全体を4階層構成としたことにより解決された。

Advertisement