メインコンテンツに移動

7. データの公開と共有

teikemdrupaladmin に投稿

構造化テキストデータを公開するにあたっては、構造を踏まえた視覚的表現やインタラクティブな操作を伴う方法や、単にデータをそのまま公開して広く共有し、再利用されることを目指す方法まで、様々な公開方法がある。

視覚化を伴う公開:見やすいインターフェイスを通じて

視覚的表現やインタラクティブな操作を伴う公開方法には、既存のTEI対応ビューワを利用する方法や、独自ビューワを開発する方法がある。TEIはXMLに準拠しており、XMLは国際標準規格として非常に幅広く活用されているため、開発ツールなども充実しており、独自ビューワの開発は比較的容易である。既存のTEI対応ビューワもそのような文脈から様々に開発されてきている。東アジア/日本に特化したものとしては、TEI古典籍ビューワが利用方法が簡便であり広く使われている。また、東アジア/日本に限定しなければ様々なシステムやビューワが公開されているため、適宜利用されたい。

データそのものの公開・共有

構造化テキストデータの共有に関しては、前章で触れたようにGitHubやGitLabで行なうことが一つのスタンダードになっている。これらのサイトに載せたデータは、再利用も比較的容易であり、データを広く活用されたいと考える場合は適した手法の一つと言えるだろう。

一方、研究データという文脈では、大学等の機関リポジトリが受け入れている場合にはそこに掲載するのが一つの方法だろう。国際的にはCERN等が運用するZenodoというサイトが広く使われており、これは日本からも掲載可能である。論文掲載時に根拠となった研究データを同時に掲載するという手法も増えてきており、日本でもJ-STAGEがJ-STAGE Dataというサービスを提供している。また、データジャーナルと呼ばれる、研究データを公開するためのジャーナルも刊行されており、人文学向けには日本デジタル・ヒューマニティーズ学会の『デジタル・ヒューマニティーズ』や、『Journal of Open Humanities Data』という国際誌が研究データの掲載に対応している。このような場で公開すると、DOI (Digital Object Identifier)が付与される場合もあり、研究データとしての安定性を高めることができる。

あるいは、研究者コミュニティとしてリポジトリを運用する例もある。構造化テキストデータに関しては、TEI協会がTapasというTEI準拠テキストデータ用のリポジトリを運用しており、これも誰でも掲載することが可能である。

構造化テキストデータは共有されることに大きな意義がある。より広く、しかし確かなデータとして共有されるための方法は、研究分野や手法によって様々だが、上記のガイドを踏まえ、自らのニーズに沿った道を探っていただきたい。