国の動きが気になります!(韓国の研究データ管理プラットフォーム編)
その他, 2021.03.02お久しぶりです。パクです!
昨年度初めて参加したJaLCのイベント「対話・共創の場」が、今年度はオンラインで開催されたので参加してきました。
※昨年度の様子は「こちら」
今回のテーマは「コロナ禍を背景とした研究のデジタル化ソリューションに向けて」で、「デジタル化」をキーワードに幅広い分野の方から、研究現場のデジタル化の事例や課題などについて話題提供講演がありました。また、講演後はいくつかのグループに分けて話題について意見交換も行いまして、研究環境の変化や困りごとなどが共有できる、とても有意義な時間でした。
JaLCのイベントページにて、今回の講演資料及び一部の講演動画を公開していますので、興味のある方はぜひご覧ください。
さて、世界中がコロナで大変な今、研究のデジタル化は日本だけではなく全世界の話題だと思います。そこで、本日は「他国の動きが気になる!」ということで、昨年正式にサービスを始めた韓国の研究データ管理プラットフォーム「DataON」について紹介したいと思います。
「DataON」ってなに?
DataONは韓国のKISTI(韓国科学技術情報研究院)が運営する、国家研究データプラットフォームサービスです。2020年1月にサービスを開始しました。
当サービスで注目すべきところは研究データの収集、共有、分析、活用などの研究全般を支援するプラットフォームであることです!
具体的にどういうサービスがあるかですが、残念ながらWeb画面は韓国語と英語だけ選択でき、英語を選択してもタブ以外のサービス説明は韓国語になっています。Google翻訳で日本語にして見ましたが、うまく翻訳されなかったです。。(涙
(一応サービス提供前の広告動画ですが、英語版の広告動画はありましたので、ご参考までにどうぞ!)
でも大丈夫です!私は韓国語が得意(!)なので、自分で確認したDataONの代表的な特徴を代わりに説明します。
特徴1. 国内外の膨大な研究データの収集と検索が可能です。
まず、どれくらいの研究データを保有しているかですが、DataONは様々な海外機関と連携して世界中の研究データを収集、共有していますので、利用者はデータの検索と収集にかかる時間が節約できます。代表的な機関として、以下の機関と連携しています。
- ヨーロッパのOpenAIRE(Open Access Infrastacture for Research in Europe. ヨーロッパ全体の研究論文及び研究データリポジトリを統合・連携した、ヨーロッパ最大の研究データ統合プラットフォーム)
- オーストラリアのARDC(Australian Research Data Commons. オーストラリア政府主導の下、研究データインフラおよびサービスの運用・管理などを行うイニシアチブ)
- 日本のIRDB(Institutional Repositories DataBase. 日本国内の学術機関リポジトリに登録されたコンテンツのメタデータを収集し、提供するデータベース・サービス)
検索については、表/画像、データセット、ソフトウェアの3つのコンテンツ区分の中で必要な研究データが検索できます。タイトルやキーワードなどの検索条件を利用して詳細検索することも可能です。
(ちなみに、ソフトウェアというのは、利用者がデータ分析のため使用するオープンソースソフトウェアと利用者が直接開発したソフトウェアのうち、CANVASに登録されているソフトウェアのことで、2021年2月の時点で20個のソフトウェアが登録されています)
※ CANVAS:DataONで提供する分析サービス(Creative ANalysis enViroment and System)
また、データ共有サービスとしてOpenAPIとOAI-PMHも用意していますので、外部機関はDataONのデータを便利に利用できます。
特徴2. 研究データの登録と活用が可能です。
利用者は自分の研究データをDataONに登録して共有することができます。もし登録する研究データにDOIがない場合は新しくDOIを付与します。
また、DataONのオンラインクラウドサービスである「マイドライブ」を利用して自分の研究データを管理したり、興味ある研究データを管理する(ブックマーク)こともできます。マイドライブで管理するデータを他の利用者又はコミュニティで共有することもできますので、より円滑なコミュニケーションができます!(コミュニティについては後で説明します)
マイドライブとは別に、機関のデータ管理者向けのリポジトリホスティングサービスというのもあります。簡単にいうと、機関自ら研究データを保存、管理できるリポジトリを提供するサービスです。対話・共創の場でも「システムや人手がたりないので研究データの管理に困っている」という話がありましたが、韓国もそのような機関があるためこのサービスを用意したのだと思います。
特徴3. 研究データのクラウド分析環境(CANVAS)を提供します。
DataONは研究データ活用の向上及び便利な分析を支援するためCANVAS(Creative ANalysis enVironment and System)というクラウド分析サービスを提供します。
主なサービスは以下の3つです。
- JupyterLab開発環境
研究者の方々はご存知かと思いますが、JupyterLabはデータ分析時によく使われるWeb型の対話型開発環境(IDE)です。JupyterLabのサーバリソースを選択するだけですぐに利用できます。
- Workflow開発環境
一般的にデータ分析というのは、データ収集、抽出、変換、可視化などの一連の作業で構成され、複数のタスクを連結して実施します。ここでいうワークフローというのは、このタスクで使われるアプリケーションの連結構造を意味しており、CANVASはワークフローを開発するための、Web型のGUI開発環境を提供します。
- Software
提供者により公開され、CANVAS又は外部システムで使用できるソフトウェア(ソースコード、ワークフロー、アプリケーション)を提供します。自分でソフトウェアを登録して共有することもできます。
特徴4. 研究コミュニティサービスを提供します。
利用者間の交流を支援する、コミュニティサービスです。利用者は既存のコミュニティに参加したり、新しいコミュニティを作ることで他人とデータを共有して協業することができます。色々な人たちとの活発なコミュニケーションは、新しい研究アイデアを生み出す機会にもなりますので、とてもよいサービスだと思います。
終わりに
以上、今日は韓国のサービスを紹介しました。いかがでしたか。
今回の調査でわかりましたが、韓国は国でオープンサイエンスを積極的に推進していて、特に研究データの保存、管理、共有を強調していました。それがコロナ事態で加速化して、その成果物の1つとして今のDataONがうまれたとのことです。
世界中がコロナで大変な今ですが、オープンサイエンスを積極的に推進する機会となり、データを共有する文化が定着して、色々なシステムが開発されたらよいですね。
それでは皆さん、良いオープンサイエンスライフを!