メインコンテンツに移動

5.3. 電子文書としての書誌情報の記述

teikemdrupaladmin に投稿

基本的な考え方

電子文書は、ともすれば、そのファイルが何であったかという情報が抜け落ちた状態で流通しがちである。たとえば、データベースに電子文書ファイルが格納されてメタデータを付与されて閲覧・検索できる状態になっていた場合に、電子文書ファイルにメタデータが含まれていなかったとしたら、その電子文書ファイルだけで受け渡しが行なわれると、それが何であったかわからなくなってしまう場合がある。そのような状況を避けるためには、その文書がどういうものであるか、ということについての情報を明示的に記述しておくことが安全である。

人文学におけるテキストデータでは、TEIガイドラインがこの問題に長く取り組んできており、様々な状況に対応可能な記述手法を提示している。基本的な事柄については前章に書いたとおりである。さらに詳細な対応については、TEIガイドライン本体第二章の日本語訳を参照(https://www.dh.ku-orcas.kansai-u.ac.jp/?p=791)されたい。

7. データの公開と共有

teikemdrupaladmin に投稿
構造化テキストデータを公開するにあたっては、構造を踏まえた視覚的表現やインタラクティブな操作を伴う方法や、単にデータをそのまま公開して広く共有し、再利用されることを目指す方法まで、様々な公開方法がある。

6. データの保存

teikemdrupaladmin に投稿
作成した構造化テキストデータは、簡単に失われたりすることなく、広く活用できるようにすることが望ましい。ここでは、その観点から、関連するいくつかの事項について解説する。

TEIの全般的な解説

teikemdrupaladmin に投稿
TEI(Text Encoding Initiative)ガイドラインは,人文学研究者が中心となってデジタル資料の構造的記述を行うことを目指して始まったものであり,開始当初の思想と状況については当事者達の講演録が日本語訳されている のでそちらをご覧いただきたい。ここでは,TEI がどのようなものであり,どのように有用であるかについて,いくつかの事例とともに概観する 。

東アジア/日本におけるテキストの構造化

teikemdrupaladmin に投稿
ここでは、TEI (Text Encoding Initiative) 協会が策定・公開している人文学資料デジタル化のためのガイドラインであるTEI P5ガイドラインに基づき、日本を含む東アジアにおける文献資料をテキストデータとして構造化するための具体的な手法について解説する。