ダークアーカイブって?

J-STAGE, 2018.08.16

こんにちは、ダニエル・イッスです。

暑い夏が続きますね。みなさん何か夏らしいことしていますか?

私は小学生以来、約30年ぶりにラジオ体操に参加してます。地元の自治会の体育文化部に属しているのですが、その体育文化部が主催となって子供向けにラジオ体操を実施しています。50~60人の子供たちの前で私が見本を見せるわけですが、ラジオ体操第2はやったことがなかったのでかなり特訓しました。おかげで第2の曲が頭から離れない夏になってます。

さて、今回はダークアーカイブについてお話してみたいと思います。

『ダークアーカイブって?』

と思う方もいるかもしませんが、『ダーク』という言葉から、暗い・怖いイメージを感じるかもしれません。夏らしく少し怖い話を・・・という訳ではなく、ちゃんと学術に関するお話です。

ダークアーカイブを端的に言うと「電子化されたジャーナルの長期保存を保証するサービス」であり、これまで蓄積された学術研究を永続的に保管していく上でとても重要な役割を担っています。

例えば、皆さんがスマートフォンや携帯に保存してある連絡先ですが、ほとんどの方は何かしらのバックアップサービスに保存しているかと思います。携帯をなくした、または壊れた時のために、大切な知人・友人の情報は失わないようバックアップを取っておきますよね。それと同じように、学術研究においても、公開先のサイトが何かしらの理由で公開できなくなった時、そのサイトの代わりとなって公開を継続させるサービスがダークアーカイブです。

PorticoとCLOCKSSとは

ダークアーカイブを運営する代表的なサイトとして「Portico(ポルティコ)」と「CLOCKSS(クロックス)」の2つが挙げられます。
前者の「Portico」はアメリカの非営利団体であるIthakaが運営しています。Porticoのサイトを除いてみると1,000を超える図書館、500を超える出版社が参加していることがわかります。

それに対し後者の「CLOCKSS」ですが、こちらはアメリカのスタンフォード大学で開始されたアーカイブプロジェクトをベースとし、現在では出版社と図書館との共同で運営する体制をとっています。現在こちらは300を超える図書館、250を超える出版社が参加しています。

以下は、それぞれの特徴をまとめたものです。

Portico CLOCKSS
運営 Ithakaが運営 出版社と図書館の共同運営
参加出版社数 約500 約1,000
参加図書館数 約250 約300
保存方法 集中型
※1つに集約した保存
分散型
※複数の機関のサーバに分けて保存
利用料
※Publisher向け
$250~$81,960 $250~$27,275

(参加数、利用料は2018年8月時点)

ダークアーカイブに参加してもすぐにそのサイトで論文が公開されるわけではありません。ダークアーカイブは、現在公開しているプラットフォームが自然災害等の何かしらの事情でコンテンツの提供が難しくなった場合に、その代わりとなって公開※するものになります。なので、通常は非公開です。
※Porticoでの公開例、CLOCKSSでの公開例

 

PubMedの収録条件にも

世界の主要医学・生命科学系雑誌等が掲載されているPubMedでは、オンラインジャーナルをPubMedに収録する条件として、PMCまたはPortico、CLOCKSS等のアーカイブサイトへデータ連携することが義務付けられています(PubMedやPMCについてはジャーナルカフェのこちらの記事をご参照ください)。

そのため、これからPubMedの収録を目指す医学・生命科学系のオンラインジャーナルは、雑誌の永続性を担保する必要があります。PMC用にXMLデータを作成しそれを公開するのも一つの手ですが(PMCへの掲載も事前の審査が必要です)、J-STAGEも2018年度中にPorticoとの連携を開始しますので、今後はJ-STAGEに公開することで条件を満たすことになります。また、J-STAGEはPubMedとも連携していますので、PubMed収録誌であればJ-STAGEに公開するだけで自動で書誌データをPubMedに送信するサービスも行っています。

最後は医学・生命科学系の話になりましたが、医学・生命科学系以外でもオンラインジャーナルの永続性を担保する上で、このようなダークアーカイブの存在は重要かと思います。自分たちのジャーナルを守るためにも、現在公開中のプラットフォームがダークアーカイブに参加しているかなど一度確認してみてはいかがでしょうか。

ではでは。