J-STAGEのアクセス数って気にしてますか?[PART 1:アクセス統計データ]

J-STAGE, 2023.08.22

こんにちは。暑い季節はエアコンの効いている部屋よりプールが好きなジェイミーです。

ミッション・インポッシブル最新作「デッドレコニング PART1」が最高すぎて字幕版を観た後で吹き替え版も観てしまいました。「デッドレコニング PART2」が1年後らしいのですが、「PART2」が公開される時にどこかの映画館で「PART1」と「PART2」を続けて観れるようにしてくれないかと思っています。

今後の興行収入や観客動員数が気になりますが、J-STAGEに公開されている記事のアクセス数を気にしたことはありますか?
アトラスはJ-STAGE利用学会の公開用データ作成の代行もしていますが、学協会の担当者に編集委員会などでアクセス数などは議題になるか質問してみたところ「ほとんどない」「そもそも報告していない」と意外な回答が多かったです。

と言うことで、今回はJ-STAGEが発行機関に提供しているアクセス統計データ関連を2回に分けてお伝えしていきたいと思います。

1.J-STAGEのアクセス統計データとは?

J-STAGEに論文を公開しているジャーナルの発行機関には、毎月月末ごろJ-STAGEから事務局などにこんな件名のメールが届きます。

[資料コード:ABC] J-STAGEアクセス統計データ ダウンロード準備完了(2023年07月分)
 ※例として2023年8月末に届くメールの件名です
 ※ABCの部分はそれぞれのジャーナルについている「資料コード」と呼ばれる文字列が表示されています

J-STAGEでは「アクセス統計サービス」として発行機関向けに公開しているジャーナルのアクセス統計データを提供しています。

J-STAGEアクセス統計サービスの概要

提供タイミングと通知案内先 毎月月末に事務局などJ-STAGEに登録しているメールアドレス
取得できるデータの期間 先月分を含めた過去2年分のアクセス統計データ
取得できるデータ ・アクセス統計レポート

・加工済みログ

・機関別アクセスデータ

データ形式 TAB区切りのテキストファイル

取得できるデータのうち、世界中からの一般的なアクセス数は「アクセス統計レポート」と「加工済みログ」に分けて提供されています。「機関別アクセスデータ」は、購読機関と呼ばれる図書館や大学などに限定されたアクセスデータです。

一般的なアクセス数となる2つの統計データの違いは、J-STAGEに公開されているマニュアルによると以下のように記載されています。

▼「アクセス統計レポート」
J-STAGEで取得したWebサーバ及びアプリケーションのログを、アクセス統計プログラムで集計した結果です。
▼「加工済みログ」
J-STAGEで取得したWebサーバのログを、アクセス統計プログラムで加工したものです。レポートには現れない詳細な情報を発行機関が独自に解析できるようにするために提供されています。

「アクセス統計レポート」の詳細なデータが「加工済みログ」と言うことですね。
取得できるそれぞれのデータの一覧をまとめてみました。

1.1「アクセス統計レポート」と「加工済みログ」で取得できるデータ一覧

アクセス統計レポート

※サービスを利用していない場合は0件として出力されます

レポート名 概要
サマリレポート 全体の記事数、資料アラート登録数、お気に入り資料登録数、お気に入り記事登録数、被引用数を集計したデータ
記事別レポート J-STAGEの書誌情報の表示回数、PDFダウンロード回数を記事ごとに集計したデータ
国別レポート J-STAGEの書誌情報の表示回数、PDFダウンロード回数を国・地域ごとに集計したデータ
ドメイン別レポート J-STAGEの書誌情報の表示回数、PDFダウンロード回数をドメインごとに集計したデータ
購読者別レポート 機関購読者・個人購読者のアクセス数を集計したデータ
加工済みログ

※1件もアクセスがなかった場合や利用していないサービスのログは取得できません

ログ名 概要
資料トップログ 資料トップ及び投稿規程PDFに対するアクセスログ
巻号一覧・目次ログ 巻号一覧画面に対するアクセスログ
書誌事項ログ 書誌画面に対するアクセスログ
全文ログ 全文 PDF及び全文HTML対するアクセスログ
検索ログ 資料内検索入力画面及び資料内検索実行結果に対するアクセスログ
認証ログ 認証記事に対するアクセスログ
ログインログ 認証記事アクセス時のログイン画面に対するアクセスログ

2.アクセス統計データの取得方法は?

J-STAGEの発行機関に提供されている「編集登載システム」から取得できます。
ただ、「アクセス統計レポート」は誰でも取得できるわけではありません。編集登載システムにログインするアカウントに権限がないとログイン後のメニューに表示されませんのでご注意ください。

発行機関に届いたメールの本文に以下の編集登載システムへのログインURLが記載されているので、いつも使っているユーザー名とパスワードでログインします。

【編集登載システムログインURL】
https://www.jstage.jst.go.jp/edit

ここからはJ-STAGEに公開されている操作マニュアルの説明文やスクリーンショットなんかも引用しながら説明してみたいと思います。

引用元のマニュアルは「J-STAGE操作マニュアル サービス管理編」です。

  • 編集登載システムにログインしたら「サービス管理」をクリック

※引用元:J-STAGE操作マニュアル サービス管理編

  • 次の学協会メニュー画面でレポートにある「アクセス統計ダウンロード」をクリック

※引用元:J-STAGE操作マニュアル サービス管理編

  • 次のアクセス統計レポートダウンロード対象選択画面では、集計開始と終了の年月、統計データ区分、資料コードを選択・入力します。

※引用元:J-STAGE操作マニュアル サービス管理編

「集計開始年月」と「集計終了年月」で、アクセス統計データが欲しい期間を選択できるので、月をまたいだ期間でも月ごとのアクセス統計データが取得できます。ただ、注意点が3つありますのでまとめてみました。

①「集計開始年月」は、取得操作をした月の2年前までしか選択できません。以前アトラスのお客様の学会で、それ以前の統計データが欲しいとJ-STAGEへ問い合わせをされた際に、『J-STAGE側でもそれ以前の統計データは保有していない』と回答があったそうなので注意してください。
2023年8月時点だと「2021年9月」、2023年9月になると「2021年10月」となります。

②「集計終了年月」は、先月分が取得できる最新のデータになります。ただ、なぜか画面上には取得操作の当月が選択項目に表示されている場合もあるので、そのまま当月を選択してしまうと「指定された集計期間のアクセス統計レポートが存在しません。」とエラーメッセージが表示されますので注意してください。

③「資料コード」は、必須なので忘れずに入力しましょう。
そう言えば「資料コード」ってナニ?と思う人もいるかもしれませんので説明しますと「資料コード」はJ-STAGEでジャーナルを識別するための文字列でそれぞれのジャーナルページのURLに含まれています。

▼J-STAGEのジャーナルトップURL
https://www.jstage.jst.go.jp/browse/ABC/-char/ja
ABCの部分がジャーナルごとにある「資料コード」の文字列です

「統計データ区分」は、取得したいデータによって「アクセス統計レポート」「加工済みログ」「機関別アクセスデータ」を選択できるので、今回は「アクセス統計レポート」を選択して「確認」ボタンをクリックします。

次のアクセス統計レポートダウンロード確認画面に「ダウンロード」ボタンが表示されるのでクリックすると、自分のPCのダウンロードフォルダにZIP形式のファイルが保存されます。

※引用元:J-STAGE操作マニュアル サービス管理編

それでは、ダウンロードしたZIPファイルを確認します。
一番上のZIPファイルが集計開始年月「2022年6月」~集計終了年月「2023年6月」の合計アクセス統計データ、その下にあるZIPファイルが各月のアクセス統計データです。

各月のZIPファイルを展開すると取得できるデータ一覧にある「記事別レポート」「国別レポート」「ドメイン別レポート」「購読者別レポート」「サマリレポート」が保存されています。

3.アクセス統計データをチェックしてみましょう。

それぞれのアクセス統計データは、これもJ-STAGEに公開されている操作マニュアル「アクセス統計サービス 統計データ解説書(発行機関編)」の説明文やスクリーンショットなんかも引用しながら説明してみたいと思います。

まず、それぞれのデータはタブ区切りテキストファイル(TSV形式)なのでExcelファイルやGoogleのスプレッドシートなどにインポートかコピー&ペーストして編集・分析する必要があります。
「アクセス統計レポート」では、主に3つのレポートを見てみたいと思います。

①資料全体のアクセス数を集計した「サマリレポート」
「資料基本情報(作成日時点)」では公開されている記事数や被引用数の合計が確認できます。「アクセス数(画面別内訳)」では各画面へのアクセス数の合計と日本語・英語ページの内訳も確認できます。

※引用元:アクセス統計サービス 統計データ解説書(発行機関編)

②「記事別レポート」
次にチェックする記事別レポートは、記事毎にアクセス数を集計したデータです。記事はDOIで確認できるようになっており、各画面のアクセス数の他にレポートの作成日時点で対象記事を引用している記事数のデータ「被引用文献登録数」が確認できますので、フィルターを使えば被引用数の多い記事のランキングも作成できます。

※引用元:アクセス統計サービス 統計データ解説書(発行機関編)

③252ヶ国からのアクセス数を集計した「国別レポート」
2023年外務省のデータでは世界の国は196ヶ国となっていますが、国別レポートの252の「国」は「地域NIC(Network Information Center)※」が割り当てたIPアドレスと国の対応表から求めています。
※地域や国ごとにインターネット上で利用されるIPアドレスやドメイン名などの管理、割り当てを行う機関
また、対応表にない「国」からのアクセスは「その他」、アクセス元IPアドレスから「国」を特定できなかった場合には「不明」として集計されます。
ちなみにこの「国」には「南極」もあるので、いつか南極の観測基地からアクセスがあるかも知れませんね。

※引用元:アクセス統計サービス 統計データ解説書(発行機関編)

他には「ドメイン別レポート」や「購読者別レポート」もありますが、まずは紹介した3つのレポートからデータをグラフ化することで、アクセスやPDFのダウンロード数が多かった国や地域の現状を把握できますし、記事へのアクセス数とPDFのダウンロード数との相対関係を調べることもできます。

「被引用文献登録数」の多い記事についても「記事別レポート」「国別レポート」のデータを組み合わせることで被引用の多い理由を考察できるかも知れません。

続いて「加工済みログ」ですが、最初の取得できるデータ一覧で書いたように「アクセス統計レポート」の詳細な統計データなので、以下は資料トップログの例ですが、1件1件のアクセスに関するIPアドレスやドメインなどが分かるようになっています。

個人的には「アクセス統計レポート」の内容で十分だと思いますが、より詳細まで確認したい場合は利用しても良いかと思います。

「網掛け部分は、2005年2月1日10時30分42秒に、IPアドレスが”xxx.xxx.xxx.xxx”であるホストより、 資料コード”stis0″の資料トップ画面(“TOP”)の英語画面(“E”)にアクセスがあった。資料トップ画面であるので、論文コード(巻_開始頁)は存在しない(“-“)。このホストのIPアドレスは、日本(“JP”)に割り当てられたものであり、DNS を逆引きした結果は、”abc.xyz.go.jp”であった。」

※引用元:アクセス統計サービス 統計データ解説書(発行機関編)

4.意外に使える統計データがたくさんある「アクセス統計サービス」

いかがでしたか?「アクセス統計サービス」は、意外に使える統計データがたくさんあったのではないでしょうか?
「アクセス統計レポート」「加工済みログ」は、統計データとして蓄積していくと今後のジャーナルの運営方針を考えるうえで有益な参考資料になるのではないかと思います。

アトラスでも「アクセス統計サービス」を活用した編集委員会向けのサービスを準備中です。
次回は、編集登載システムで記事のアクセス数などを確認するために2022年に機能追加された「ダッシュボード機能」をご紹介したいと思います。

See You Later !!