Fandom

人工言語学 Wiki

CSV形式

58このwikiの
ページ数
新しいページをつくる
コメント0 シェアする

CSV形式とは、PDICからのエクスポートやPDICへのインポートを目的とした辞書フォーマットの一つである。CSV (カンマ区切り)を元にしているため、表計算ソフトやテキストエディタでも編集することができる。

Ziphil ShaleirasによるTWOC等のオンライン辞書サービスのデータとして、UTF-8(BOM無し) LF のCSV形式が用いられている。

仕様 編集

一つの単語を一つのレコードで表し改行でそれぞれのレコードを区切る。レコード内では、見出し語や訳語などの項目をコンマ「,」で区切って並べる。

1番目のレコードはヘッダーとなっており、項目の順番を示す。デフォルトの項目の順番を以下に示す。

  • word (見出し語)
  • trans (訳語)
  • exp (用例)
  • level (単語レベル) ―― 0〜15の数値
  • memory (暗記マーク) ―― 0(暗記マーク無し)または1(暗記マーク有り)
  • modify (修正マーク) ―― 0(修正マーク無し)または1(修正マーク有り)
  • pron (発音記号)
  • filelink (ファイルリンクまたはOLEデータ)

これらに加え、keyword (検索キー) の項目を含むこともできる。

項目中にコンマ「,」、ダブルクオート「"」、改行を含む場合は、項目全体をダブルクオートで囲まなけばならない。またその内部で、ダブルクオートはダブルクォートで重ねる「""」で表現される。 PDICから出力されるCSV形式ファイルでは、データが数値となるlevel, memory, modify以外の項目は全てダブルクオートで囲まれているが、必須ではない。

文字コード 編集

PDIC for Win32で出力したCSV形式のファイルは Shift_JIS CRLF、PDIC/Unicodeで出力したCSV形式のファイルは UTF-16LE(BOM有り) CRLF となる。PDICにインポートする場合はこれら以外の文字コードもいくつか使用可能である。

外部リンク 編集

広告ブロッカーが検出されました。


広告収入で運営されている無料サイトWikiaでは、このたび広告ブロッカーをご利用の方向けの変更が加わりました。

広告ブロッカーが改変されている場合、Wikiaにアクセスしていただくことができなくなっています。カスタム広告ブロッカーを解除してご利用ください。

Fandomでも見てみる

おまかせWiki