目的
「東アジア/日本におけるテキストデータ構造化ガイドライン(East Asian/Japanese Text Encoding Guidelines, EAJ ガイドライン)」は、日本を含む東アジアにおいて伝来してきた文献資料をデジタル媒体の特性に即して適切に記述し保存していくための手法を提示することを目的としている。
デジタル媒体の特性を活かして文献資料における様々な要素を他者と共有できるようにすることは、これまでは半ば暗黙的に共有してきた情報を同分野のみならず異分野も含めた他の研究者や研究者以外の様々な人々に開いていくことである。そして、デジタル媒体の特性をうまく生かすことができたなら、わかりやすい形で視覚的に表現したり、膨大な量の情報を必要に応じて適宜表示したり、そこからさらに特徴的な箇所を取り出したりすることもできるようになる。本ガイドラインは、このような状況を人文学において創出することを目的として作成されている。
なお、EAJガイドラインは、日本だけでなく東アジアへと対象を拡張しているが、その理由は二つある。一つは、日本における文献資料が、東アジアの漢字文化圏のなかで長く育まれ伝えられてきたものであるために、特に伝統的な日本のテキストデータの構造化を検討することは東アジア全般のそれについて検討することと同義に近いものになるためである。今ひとつは、テキストデータ構造化の国際デファクト標準である Text Encoding Initiative Guidelines(TEIガイドライン)が、非欧米言語全般への対応についてまだ十分な検討がなされていない面があり、これに関して東アジアという枠組みでテキストデータ構造化について検討することがテキストデータ構造化の国際化に大きく貢献し得るからである。
現状と今後
EAJガイドラインは、TEIガイドラインと同様に、東アジアのテキストデータ構造化に関わる研究者のコミュニティによって作成されるものである。したがって、汎用性という側面では有用性を提供し得るものの、現時点では、テキスト研究に関わるすべての分野の個別のニーズに完全に対応しているものではないことにご注意いただきたい。そして、TEIガイドラインと同様に、コミュニティの広がりと要請に伴って拡張されるものであり、いわば、成長するガイドラインとして理解していただきたい。また、その意味で、様々な分野からのこのコミュニティへの参画を期待する。
成り立ちについて
EAJガイドラインは、文部科学省委託事業「人文学・社会科学のDX化に向けた研究開発推進事業(データ基盤の開発に向けたデジタル・ヒューマニティーズ・コンソーシアムの運営)(以下、人文DX事業)」の成果の一部として公開されている。
この人文DX事業は、人間文化研究機構が受託した事業である。そのうちでテキストデータの構造化に関する事業が慶應義塾ミュージアム・コモンズに再委託されたことにより、この成果については慶應義塾ミュージアム・コモンズのサイトから公開されている。
このガイドラインは、TEI協会東アジア/日本語分科会(TEI Consortium, East Asian/ Japanese SIG)やSAT大蔵経テキストデータベース研究会、国文学研究資料館をはじめとしてTEIガイドラインに関わる様々な研究者や組織が公開する成果を踏まえたものである。
なお、このガイドライン作成にあたり行なわれた研究については、JSPS科研費JP25H00001, JP24K03232, JP23H00002, JP23K17500, JP23K28385, JP20H05830の助成を受けた。