FANDOM


辞書の濃さ(DRP, Dictionary Richness Point)とは、人工言語における辞書の情報密度を表す数値のひとつである。Fafs falira sashimi氏が2014年に考案、2015年7月に辞書の情報密度を表す数値として提案した。

定義 編集

DRPは「辞書における、1単語あたりの情報量」として定義される。なお、ここでいう情報量とは、情報科学的な量(エントロピー)ではなく、単に字数に依拠して記述を定量化したものを指す。以下に述べるように、現時点で2通りの算出方法が提案されている。

PDIC方式編集

一般的な算出方法は、PDICを使ったものである。

  1. 最適化済みの人工言語の.dicファイルを用意する。
  2. (ファイルサイズ÷単語数)を小数第三位切り捨てで計算する。

たとえば、リパライン語の辞書は2016年8月12日時点において203.58DRPとなっている。

おかゆメソッド編集

おかゆ氏は、辞書から無作為に数百単語(可能であれば全単語)をサンプリングし、それぞれの単語の項目の文字数の平均を取るという算出方法を提案している。この算出方法では標準偏差も計算できるため、記述の偏りも見積もることができる。PDIC方式と異なり、各辞書の形式を同形式に整えないで計算するため、PDICの辞書形式をもたない人工言語でもDRPが算出できる一方で、辞書形式それ自体による系統誤差が生じる。

問題点・疑問点 編集

  • この数値に対して、特定の解釈が日本人工言語界隈において合意されていない。
  • PDIC方式では、PDICの辞書形式を持つ人工言語でしか算出ができない。
    • またPDICを用いた場合、プログラムの都合等、辞書の記述と無関係な要因がファイルサイズに影響を与えていると思われる。
  • 人工言語自体への評価とは関係ない。
  • TP (単位)のように、基準となる目安が2015年8月現在で確立されていない。
  • どの方式で算出されたのかを明記する必要があるが、それを明記することへの合意がなされていない。

広告ブロッカーが検出されました。


広告収入で運営されている無料サイトWikiaでは、このたび広告ブロッカーをご利用の方向けの変更が加わりました。

広告ブロッカーが改変されている場合、Wikiaにアクセスしていただくことができなくなっています。カスタム広告ブロッカーを解除してご利用ください。