メインコンテンツに移動

6. データの保存

teikemdrupaladmin に投稿

研究データ管理

2025年現在、科研費の助成を受けた研究は、データマネジメントプランの作成が義務づけられている。ここでは、研究活動により成果として生じる研究データの保存・管理、公開・非公開等に関する方針や計画を記載する必要がある。同時に、研究データにはメタデータを付与することも求められており、さらに、研究データリポジトリなどに掲載して広く公開することも期待されている。本ガイドラインに沿って作成された構造化テキストデータもまた典型的な研究データであり、そのようにすることでより確実に管理し、広く共有されることが期待される。

バージョン管理

構造化テキストデータを含む研究データの作成と保存にあたり、改訂を伴う可能性のあるデータの場合には、バージョン管理が重要となる。これについては、研究データリポジトリにおいてもバージョン管理の概念を持つものがあり、それに従って適宜バージョンアップを行なっていくというのが一つの方法である。

一方、テキストのバージョン管理はプログラミングにおいては重要な事項であり、プログラミング従事者達の間で広く利用されているシステムを活用することも選択肢になり得る。GitHubやGitLabといったシステムを利用して人文系研究データを公開する例は着々と増えてきており、過去のデータへの確実なアクセスを担保しながら容易に更新をかけていける仕組みとして活用されている。

バックアップ

バックアップに関しては、何らかのメディアに複製を保存するという方法と、クラウドストレージに保存するという方法が現在は主流である。

ローカルメディアへの保存

ローカルメディアへの保存には、いくつかの選択肢があり、それぞれに特徴がある。まずはよく用いられるものを見ていこう。

ハードディスク(HDD)は比較的安価で大容量であるため、バックアップにもよく使われるが、物理的に稼働する部分が故障する場合があり、故障を前提として利用する必要がある。HDDを複数接続して故障耐性を高めるRAIDと呼ばれるシステムも広く利用されており、複数接続により容量が大きくなることや、HDDが故障しても複数接続している他のHDDにデータが自動的に残されているためにデータが損なわれないこと、1台HDD故障時にシステムを停止させずに壊れたHDDのみの交換が可能である(ホットスワップ)ことなど、いくつかの大きなメリットがある。ただし、RAIDシステム自体が故障することもあり、その場合にはシステム全体のデータが救出できなくなるため、これだけでバックアップが万全になるというわけにはいかないので注意が必要である。

SSD、SDカード、USBメモリなどに用いられている不揮発性メモリは、書き込みが速いものもあるため、短期間のバックアップには有用な場合がある。しかし、不揮発性メモリは数年でデータ自体が消失してしまう場合があることや、それ自体の寿命もそれほど長いものではないため、長期保存には不適である。また、故障に関しては、何の前触れもなくある日突然読み込めなくなるという形で発生するため、やはり他にもバックアップが必要となる。

磁気テープは大容量の長期間バックアップのために現在もよく用いられる。数年に一度、規格がアップデートされて大容量化が行なわれており、2025年時点の最新の規格であるLTO9では、テープ1巻あたりで非圧縮時18TB、圧縮時45TBの保存が可能であるとされている。テープ自体には稼働部分がなく、テープの磁気は消失しにくいため、比較的安定したバックアップが可能である。ただし、テープドライブもテープもかなり高額であり、ドライブが安いもので100万円前後、テープが1本あたり2~3万円程度となる。バックアップの容量が増えれば増えるほどコストは下がっていくものの、初期投資はかなりの負担になる。また、テープが切れるなどして読み込めなくなる場合もないわけではないため、複数のテープに複製を残したり、他のメディアも併用するなど、何らかの対策は必要となる。

クラウドへの保存

クラウドへの保存は、データ容量が多くなければ、比較的安定性が高いと言えるだろう。構造化テキストデータの場合には、デジタル画像を含まなければあまりデータ容量が大きくならないため、クラウドへのバックアップは現実的な選択肢と言っていいいだろう。ただし、クラウドへの依存が高まった場合、急な利用料引き上げなどに対応しなければならない場合もあり、注意が必要だろう。また、データが大容量になる場合、バックアップや復元をネットワーク経由で行なわねばならないために時間がかかってしまうことや、利用料引き上げ時の影響が大きくなるといった課題がある。これらの課題を踏まえて、クラウドの利用は検討するべきである。