目次

1 変更対応表
10 データ利用の申請
12 FAQ

AMEDデータ利活用プラットフォーム 操作マニュアル(一般)

目次

1 変更対応表
2 共通内容
3 ログイン
4 共通機能
5 ダッシュボード(TOP)
6 メタデータ
7 プロジェクト情報
8 予備的処理
9 お知らせ・ヘルプ
10 データ利用の申請
11 補足
12 FAQ

1 変更対応表

2024/7/23に以下の変更を行いました。
マニュアルは旧システムのままとなっているため、適宜読み替えてください。
・メニューの表示順変更


・データ管理画面項目の表示順変更


・メニュー名称変更
メニュー名称の新旧対照表
旧ラベル新ラベル
メタデータMetadataメタデータ検索Search Metadata
処理環境アップロードAnalysis Environment UploadDockerイメージアップロードUpload Docker Image
アップロード済み処理環境一覧List of uploaded analysis environmentDockerイメージ一覧Docker Images
データファイルアップロードData File UploadユーザファイルアップロードUpload User File
データファイル一覧Data File Listユーザファイル一覧User Files
予備的処理結果ファイルコピーPre-Research Results File Copyアレル頻度データをユーザファイル(VCF)としてコピーCopy Allele Frequency Data as User File (VCF)
ファイルダウンロードPre-Research Preset File DownloadダウンロードDownloads
サンプルセット登録Sample Set Registrationアレル頻度データ作成Generate Allele Frequency Data
サンプルセット一覧Sample Set Listアレル頻度データ一覧Allele Frequency Data
処理環境登録Analysis Environment RegistrationDocker環境作成Setup Docker Environment
処理環境一覧Analysis Environment ListDocker環境一覧Docker Environments
連携システムの利用Use of Computer Systems on Collaborative Center(※ページ上部も同様)連携システムの利用Login to Computer System on Collaborative Center(※ページ上部も同様)

・サンプルセット一覧の「データ利活用プラットフォーム基本サンプルセット」の名称を「CANNDs_23K」に変更
・データ管理画面の一番下にあるファイルダウンロードを別画面化

2 共通内容

2.1 アクセスURL

本マニュアルは「AMEDデータ利活用プラットフォーム」の操作マニュアルとなります。「AMEDデータ利活用プラットフォーム」には下記URLよりアクセスしてください。
https://prod-www.cannds.amed.go.jp/web/login/init

※本マニュアルに記載されている「連携システムの利用」「遺伝型インピュテーション」機能を利用するためには、上記URLとは別URLからのアクセスが必要です。上記機能の利用可能URLは、以下の問合せ先までご連絡ください。
 E-mail: platform"AT"amed.go.jp("AT"の部分を@に変えてください。)

2.2 画面構成

各機能は以下の画面より構成されます。各画面の操作については、それぞれの項を参照してください。

※「連携システムの利用」「遺伝型インピュテーション」はログインアカウントを作るだけでは利用できません。
 (データ利用審査後に利用可能となります。)
  よって本機能の利用方法については審査後にログイン後の「ヘルプ・お問い合わせ」画面からご確認下さい。

2.3 セッションタイムアウト

ログイン後、30分以上操作がない場合、セッション情報が破棄されます。
セッションタイムアウトとなった場合、再度ログインしなおす必要があります

2.4 連携スパコン側のシステムとの接続

AMEDデータ利活用プラットフォームでは接続元の環境により連携スパコン側のシステムとの接続が可能かどうかを制御します。
下図の通り、連携スパコン側のシステムとの接続を可能とする環境は、「連携システム接続」のみとなります。※1
インターネット接続の場合は「連携システムの利用」「遺伝型インピュテーション」ボタンまたは、リンクが非表示となっております為、アクセスはできない仕様となっております。(URLへの直接アクセスはシステムエラーとなります。)
※1 連携システム接続での接続先のURLはシステム管理者へご確認いただきますようお願い致します。

3 ログイン

3.1 ログイン

AMEDデータ利活用プラットフォームではログイン認証方法を2種類用意しています。
「学認(https://www.gakunin.jp/)」という認証基盤を利用し、利用者が所属する研究機関の認証の仕組みでログインする方法と、「SecurID」というAMEDデータ利活用プラットフォームが発行するログイン用IDを利用してログインする方法です。
アカウント作成時にどちらの認証方法を使用するか設定しますので、AMEDから指示された方法でログインを実施してください。(利用者ごとに認証方法は固定となります。指示されていない方法でのログインは出来ません。)
なお「SecurID」を利用したログインでは初回のログインか否かで挙動が変わります。

■「学認」を用いたログイン手順
3.2「学認」によるログイン を参照ください。
■「SecurID」を用いた初回のログイン手順
3.3「SecurID」による初回ログイン を参照ください。
■「SecurID」を用いた2回目以降のログイン手順
3.4「SecurID」によるログイン(2回目以降) を参照ください。

3.2 「学認」によるログイン

3.2.1 所属機関選択

利用者の所属する機関を選択します。
機関を選択すると、選択機関のログイン画面が表示されます。

3.2.2 所属機関での認証

選択した機関のログイン画面でログイン認証を行います。
AMEDデータ利活用プラットフォーム側で二要素認証は不要と設定されている機関での認証の場合は、ここでの認証に成功した時点でログイン成功となりダッシュボード(TOP)画面を表示します。
それ以外の機関での認証の場合は、ここでの認証に成功するとワンタイムパスワード入力画面に遷移します。

(サンプルとしてOrthrosの認証画面を表示していますが、実際に表示される画面や入力項目は選択した機関ごとに異なります。)

3.2.3 ワンタイムパスワード入力

二要素認証が必要な機関での認証操作に成功すると、登録済みのメールアドレス宛にワンタイムパスワードが記載されたメールが届きます。ワンタイムパスワードを入力して認証に成功した場合、ダッシュボード(TOP)画面を表示します。

3.3 「SecurID」による初回ログイン

初回ログインでは暗証番号登録を行います。
ログインIDと共に、連絡された初期暗証番号を入力すると暗証番号登録画面に遷移するので、
自身の暗証番号を登録してください。※2回目以降のログインでは登録した暗証番号を入力頂きます。
各画面で認証に失敗した場合、「ログイン画面(ID入力)」に戻ります。

3.3.1 初回ログイン(ID入力)

ログインIDを入力して「ログイン」ボタンを押下します。
認証に成功した場合、暗証番号入力画面が表示されます。

3.3.2 初回ログイン(暗証番号入力)

ログインID入力後は初期暗証番号の認証を行います。
認証が成功すると新暗証番号登録画面が表示されます。


新暗証番号の登録完了後は、再度暗証番号の入力を行います。
※初期暗証番号ではなく登録した暗証番号を入力してください。
認証が成功すると、ワンタイムパスワード入力画面が表示されます。

3.3.3 初回ログイン(新暗証番号登録)

登録する暗証番号を入力して「暗証番号を登録」ボタンを押下します。
登録に成功した場合、暗証番号入力画面が表示されます。
登録可能な暗証番号は以下になります。
・4~8桁の半角数字。
・直近3回使用していない暗証番号。

3.3.4 初回ログイン(ワンタイムパスワード入力)

登録済みのメールアドレス宛にワンタイムパスワードが記載されたメールが届きます。
認証に成功した場合、ダッシュボード(TOP)画面を表示します。
※メールアドレスの変更をご希望の場合はシステム管理者にお問い合わせいただくようお願い致します。

3.4 ログイン(2回目以降)

2回目以降のログインでは初回ログイン時に登録した暗証番号を入力頂きます。
システムに登録されたメールアドレス宛に都度送信されるワンタイムパスワードを用いて認証を行います。
※暗証番号を忘れた場合は暗証番号初期化を行いますのでシステム管理者にお問い合わせいただくようお願い致します。

3.4.1 ログイン(ID入力)

ログインIDを入力して「ログイン」ボタンを押下します。
認証に成功した場合、暗証番号入力画面が表示されます。

3.4.2 ログイン(暗証番号入力)

初回ログインにて登録した暗証番号を入力して「暗証番号を送信」ボタンを押下します。
認証が成功するとワンタイムパスワード入力画面が表示されます。

3.4.3 ログイン(ワンタイムパスワード入力)

システムに登録されたメールアドレス宛に都度送信されるワンタイムパスワードを用いて認証を行います。
ワンタイムパスワードを入力して「ワンタイムパスワードを送信」ボタンを押下します。
認証に成功した場合、ダッシュボード(TOP)画面を表示します。

4 共通機能

4.1 ヘッダ・メニュー

各画面には、共通のヘッダとメニューが表示されます。

4.1.1 ヘッダ

ヘッダから以下の各操作を行うことが可能です。
・別タブでの「国立研究開発法人日本医療研究開発機構」トップページ表示。
・メニューバーの開閉。
・連携スパコン側のシステムとの接続(連携システム接続用URLでのみ操作可能)。
・表示言語の日本語/英語の切替え
・ユーザ詳細画面への遷移ボタンの表示。
・ログアウトボタンの表示。




4.1.2 スパコン接続

連携スパコン側のシステムとの接続が可能です。
接続元の環境により、表示制御が異なります。
・「連携システム接続用URL」への接続の場合、表示。
・「インターネットからの接続用URL」への接続の場合、非表示。

4.1.3 日英切替

画面表示言語を日本語と英語で切り替えます。
※切り替えられるのはラベルなど固定文言だけです。日本語で登録されたデータは画面表示言語を英語にしても日本語で表示されます。

4.1.4 ログアウト

ログアウトボタンを押下するとログアウトとなります。作業終了後はログアウトしてください。

4.1.5 メニュー

4.2 パンくず

各画面の上部には、現在どの画面を表示しているかのナビゲーションを表示した「パンくず」が配置されており、リンクを押下することで対象の画面へ遷移することができます。


遷移先一覧
画面名リンク名遷移先
各画面共通TOPダッシュボード(TOP)画面
メタデータ検索画面メタデータメタデータ検索画面
メタデータ検索結果画面メタデータメタデータ検索画面
メタデータ検索メタデータ検索結果画面
メタデータ詳細画面(各データ共通)メタデータメタデータ検索画面
メタデータ検索メタデータ検索結果画面
プロジェクト一覧画面プロジェクト情報プロジェクト一覧画面
プロジェクト詳細画面プロジェクト情報プロジェクト一覧画面
プロジェクト一覧プロジェクト一覧画面
データ管理画面予備的処理データ管理画面
サンプルセット登録画面予備的処理データ管理画面
サンプルセット一覧画面予備的処理データ管理画面
バリアント一覧画面予備的処理データ管理画面
サンプルセット一覧サンプルセット一覧画面
バリアント詳細画面予備的処理データ管理画面
サンプルセット一覧サンプルセット一覧画面
バリアント一覧バリアント一覧画面
処理環境登録画面予備的処理データ管理画面
処理環境一覧画面予備的処理データ管理画面
ワークフローについて画面遺伝型インピュテーションワークフローについて画面
ジョブ投入画面遺伝型インピュテーションワークフローについて画面
ジョブ一覧画面遺伝型インピュテーションワークフローについて画面
お知らせ画面お知らせ・ヘルプお知らせ画面
ヘルプ・お問い合わせ画面お知らせ・ヘルプお知らせ画面

4.3 ソート・ページャ

メタデータ検索結果一覧、プロジェクト一覧にはソート機能とページャ機能が備わっています。

4.4 ユーザ詳細

ヘッダ部の「ユーザ詳細」ボタン押下でユーザ詳細画面に遷移します。ユーザ詳細画面ではログインユーザ自身の詳細情報表示とプロフィール画像をアップロードできます。アップロードした画像ファイルはヘッダに表示されます。アップロードファイルには、以下の制限が設けられています。
項目名制限
ファイルサイズ2MB以下
ファイル拡張子拡張子が「.jpeg」「.jpg」「.png」のいずれか
ファイルの縦サイズ560px
ファイルの横サイズ420px





登録したプロフィール画像はヘッダ部に表示されます。

5 ダッシュボード(TOP)

ログイン後の初期表示時、またはメニューの「TOP」リンクから表示される画面になります。
①緊急のお知らせ表示エリア
5.1 緊急のお知らせ を参照ください。
②計画停止等のお知らせ表示エリア
5.2 計画停止等のお知らせ を参照ください。
③メタデータサマリ表示エリア
5.3 メタデータサマリ を参照ください。
④保存検索条件一覧表示エリア
5.4 保存検索条件一覧 を参照ください。
⑤プロジェクト一覧表示エリア
5.5 プロジェクト一覧 を参照ください。

5.1 緊急のお知らせ

システムのトラブル発生時など、AMEDが利用者に緊急でお知らせする周知内容を表示します。

5.2 計画停止等のお知らせ

システムのメンテナンスなど、AEMDが利用者向けに計画的なサービス停止等をお知らせする周知内容を表示します。
表示内容は9.1 お知らせの「重要なお知らせ」表示エリアと同様になります。

5.3 メタデータサマリ

メタデータの登録件数と「登録疾患名上位10件」「性別ごとの件数」「地域ごとの件数」「年代ごとの件数」の集計グラフを表示します。グラフの要素をクリックすると、選択した要素を検索条件としてメタデータ検索を実施します。

5.4 保存検索条件一覧

保存したメタデータの検索条件一覧を表示します。
検索条件履歴が存在しない場合は「該当するデータが存在しません。」というメッセージが表示されます。
※メタデータ検索の検索条件保存については「6.1.5 保存検索条件検索」を参照

5.5 プロジェクト一覧

参画している研究計画プロジェクトの一覧が表示されます。
表示内容等は「7.1 プロジェクト一覧」と同様になります。

6 メタデータ

6.1 メタデータ検索

検索条件の入力等で、メタデータを検索出来ます。
検索方法は以下の4パターンが存在します。
・検索キーワードの入力による検索。
・保存検索条件からの再検索。
・検索条件履歴からの再検索。
・Sampleと紐付かないAnalysisデータのみの表示。


詳細条件展開時

6.1.1 検索対象メタデータ

本システムで取り扱うメタデータはJGAデータモデルに従った下記5種類の項目となります。
項目名概要詳細
Study研究に関する情報トップレベルのオブジェクトで研究内容・研究費・論文情報を含む
データ提供開始後、研究概要を示すために一般公開される
Sample検体ごとの情報Sample ≒ 個人
表現型情報(gender、age etc)や匿名化されたdonor ID
Experiment実験解析に関する情報実験手順、質問票、ライブラリー情報やシークエンサなど
1つのSampleと複数のDataオブジェクトを連結
Dataゲノムデータに関する情報個人に対応する(生)データファイル(fastq、bam、アレイデータ)を格納
Analysisデータ解析に関する情報複数のDataもしくはSampleを解析したデータを格納
例:変異データ(vcf)や表現型情報をまとめた表

6.1.2 キーワード検索(同義語)

上段のボックスに入力されたキーワードが検索対象項目のいずれかに該当するデータが抽出されます。
下段のボックスに入力されたキーワードが検索対象項目のいずれかに該当するデータは抽出対象から除外されます。
例:上段のボックスに”cancer”というキーワードを入力して検索した場合、例えばStudyの「title」「abstract」など検索対象となるいずれかの項目一つにでも“cancer”という記載があるデータが抽出されます。
下段のボックスに”cancer”というキーワードを入力して検索した場合、Studyの「title」「abstract」など検索対象となるいずれかの項目一つにでも“cancer”という記載があるデータは抽出されません。
※キーワード検索の検索対象項目は「11.1 キーワード検索の検索対象項目」を参照

「同義語を含めて検索」にチェックを入れた場合は入力キーワードの同義語も検索対象として抽出されます。
例:"アルツハイマー病"というキーワードを入力すると、同義語として"アルツハイマー"、"アルツハイマー型認知症"と言うキーワードに該当するデータも抽出されます。
同義語を含めた検索を実施したくない場合は「同義語を含めて検索」のチェックを外して検索を行って下さい。
例:"アルツハイマー病"というキーワードを入力し、「同義語を含めて検索」のチェックを外して検索を行うと
"アルツハイマー"、"アルツハイマー型認知症"に該当するデータは抽出せずに"アルツハイマー病"に該当するデータのみを抽出します。


6.1.3 検索サジェスト

「キーワード」欄に入力されたキーワードに部分一致した疾患名の一覧がサジェストとして表示されます。


6.1.4 件数確認

「件数確認」ボタンを押下すると、入力した検索条件に該当するメタデータの件数が確認できます。

6.1.5 保存検索条件検索

保存した検索条件を用いて検索できます。
「検索件数」は保存当時の件数となるため、検索実行後にメタデータの追加・削除が行われていた場合、
現在の件数と乖離している可能性があります。
「検索条件出力」ボタン押下によりJSON形式のファイルとしてダウンロードできます。
「削除」ボタン押下により保存されている検索条件を削除します。
※検索条件の保存については「6.2.1 検索条件保存」を参照

6.1.6 検索条件履歴検索

過去に入力した検索条件(直近5件分)の内容から検索が可能です。
「検索件数」は検索実行当時の件数となるため、検索実行後にメタデータの追加・削除が行われていた場合、
現在の件数と乖離している可能性があります。

6.1.7 Sampleと紐付かないAnalysisデータの検索

Analysisデータ内に「SAMPLE_REF」の記載が無いデータを一覧で表示します。

6.2 メタデータ検索結果

メタデータ検索画面で抽出されたデータに紐づくSampleの一覧が表示されます。
例:”cancer”というキーワードで検索した場合、Studyの「title」「abstract」などいずれかの項目に記載されていれば該当のデータのSampleが表示されます。

6.2.1 検索条件保存

利用頻度が高いなど繰り返し使用したい検索条件は「この検索条件を保存」ボタンを押下する事で最大10件まで保存可能です。保存結果はダッシュボード画面、メタデータ検索画面に表示され、同じ検索条件で検索できます。

6.2.2 同義語展開

6.1.2 キーワード検索(同義語)にて「同義語を含んで検索」をチェックしてキーワード検索を行った場合、同義語が確認できます。
また、任意の同義語を選択して再検索することが可能です。
例:"アルツハイマー病"というキーワードを入力すると、同義語として"アルツハイマー"、"アルツハイマー型認知症"と言うキーワードが使用されます。"アルツハイマー型認知症"は抽出対象外にしたい場合は、"アルツハイマー型認知症"のチェックを外して再検索を行う事で"アルツハイマー病"、"アルツハイマー"に該当するデータのみが抽出されます。


以下が表示を展開した状態です。

6.2.3 グラフ表示

検索結果を集計したグラフを表示します。


グラフ要素押下により絞り込み検索が可能です。
検索条件について押下したグラフと同じ項目の条件が設定されている場合、条件が上書きされます。
(チェックボックス項目の場合、押下した条件以外は未チェックとして検索を行います。
  例: RegionグラフのKantoを押下した場合、検索条件のRegion項目についてKantoのみをチェックして、Kanto以外のチェックを外した状態で検索が行われます)
「初期検索結果の再表示」リンクを押下すると、絞り込み検索前の初期状態を再表示します。


6.2.4 メタデータ検索結果ダウンロード

メタデータ検索結果をダウンロードできます。
「ダウンロードデータ作成」ボタンを押下すると表示中のメタデータ検索結果のダウンロード受付を実施し、メタデータ検索画面に作成受付のメッセージを表示します。
※1度に作成可能なファイルは1件です。作成中(或いは作成済み)のファイルがある場合「ダウンロードデータ作成」ボタンは非活性となりクリックできません。別の検索結果をダウンロードしたい場合は、作成中であればキャンセル操作を、作成済みであれば削除操作をメタデータ検索画面でそれぞれ行ってください。

ファイル作成はシステムが受け付けた順に行われ、作成が完了するとメタデータ検索画面からダウンロード可能となります。
※ダウンロードファイル作成状況はメタデータ検索画面の「作成状況はこちら」リンクを押下する事で確認できます。









ダウンロードファイル作成開始前なら「作成キャンセル」ボタンを押下するとダウンロードデータ作成をキャンセルできます。
※システム側でダウンロードファイル作成が開始されると作成キャンセルボタンは非表示となり、キャンセル出来なくなります。




ダウンロードファイル作成が完了すると完了メッセージが表示され、「ダウンロードボタン」を押下するとファイルがダウンロードできます。ファイルが不要になった場合は「削除ボタン」を押下するとファイル削除できます。
※新しいダウンロードファイルを作成したい場合は、ファイルを削除してから作成してください。

6.3 メタデータ詳細表示―SAMPLE

メタデータ検索結果画面で選択したデータに紐づくSampleのデータが表示されます。
※Sampleとは研究で利用された匿名化した検体の情報を持つデータの総称を意味します。

6.4 メタデータ詳細表示―EXPERIMENT

メタデータ検索結果画面で選択したデータに紐づくExperimentのデータが表示されます。
※Experimentとは研究においての実験手順、質問票、ライブラリー情報やシークエンサなどの実験情報を持つデータの総称を意味します。

6.5 メタデータ詳細表示―STUDY

メタデータ検索結果画面で選択したデータに紐づくStudyのデータが表示されます。
※Studyとは研究内容・研究費・論文情報を含む研究情報を持つデータの総称を意味します。

6.6 メタデータ詳細表示―DATA

メタデータ検索結果画面で選択したデータに紐づくStudyのデータが表示されます。
※Dataとは1つの実験情報(Experiment)においての実験結果の生データの情報を持つデータの総称を意味します。

6.7 メタデータ詳細表示―ANALYSIS

メタデータ検索結果画面で選択したデータに紐づくStudyのデータが表示されます。
※Analysisとは実験結果の解析、サンプル情報の解析などの解析結果情報を持つデータの総称を意味します。

6.8 メタデータ詳細表示―ANALYSIS(紐付き無し)

Sampleと紐付かないAnalysisデータを一覧で確認できます。この画面にはメタデータ検索画面の「Sampleと紐付かない(SAMPLE_REF登録のない)Analysisデータはこちら」リンクから遷移します。

7 プロジェクト情報

※本システムでは「プロジェクト」とは「研究計画プロジェクト」を意味します。

7.1 プロジェクト一覧

参画している研究計画プロジェクトの一覧が表示されます。
研究計画プロジェクト情報はシステム管理者により登録されます。

7.2 プロジェクト詳細

プロジェクト一覧画面にて選択されたプロジェクトの詳細情報が確認できます。
プロジェクトの情報、プロジェクトで利用可能なバイオバンク、プロジェクトに参画している研究者が表示されます。

8 予備的処理

8.1 データ管理

処理環境で解析を行うためのファイルアップロードや解析結果のダウンロードができます。
①処理環境アップロード・・・登録したい処理環境のDockerイメージファイルを選択し、アップロードボタンを押下してください。
②アップロード済み処理環境一覧・・・登録した処理環境のDockerイメージファイルが一覧で表示されます。不要なファイルは削除ボタンを押下することで削除できます。
③データファイルアップロード・・・登録したいデータファイルを選択し、アップロードボタンを押下してください。
④データファイル一覧・・・登録したデータファイルが一覧で表示されます。ダウンロードボタンを押下することでダウンロードできます。不要なファイルは削除ボタンを押下することで削除できます。
⑤予備的処理結果ファイルコピー・・・サンプルセット登録画面で登録したサンプルセットの結果ファイルのコピーを行えます。コピーしたいファイルにチェックをいれてコピーボタンを押下してください。
⑥予備的処理プリセットファイルダウンロード・・・システムにプリセットとして登録してあるサンプルセットファイルのダウンロードを行えます。利用規約をご確認の上、ダウンロードボタンを押下してください。

8.1.1 処理環境アップロード

AMEDデータ利活用プラットフォームが提供するテンプレートDockerイメージファイルではなくユーザ自身が作成したDockerイメージファイルを処理環境で実行したい場合は5ファイルまでイメージファイルをアップロードできます。アップロードしたイメージファイルは処理環境登録時に選択可能となります。
アップロードしたイメージファイルは「アップロード済み処理環境一覧」欄に一覧表示され、不要なファイルは「削除」アイコンを押下することで削除できます。
・アップロードしたイメージファイルは90日間利用が無いと自動削除されます。
・ユーザ自身がDockerイメージファイルを作成する際はAMEDデータ利活用プラットフォームが定めた作成ルールに従わないと正常に動作しません。作成ルールは「11.2 ユーザ作成Dockerイメージの利用手順」を参照。
またアップロードファイルには、以下の制限が設けられています。
項目名制限
ファイルサイズ2GB以下
ファイル拡張子拡張子が「.tar」「.tar.gz」のいずれか
ファイル名ファイル名に以下の文字のみ使用されている
・半角英数文字 [0-9][a-z][A-Z]
・半角感嘆符 [!]
・半角ハイフン [-]
・半角下線 [_]
・半角ピリオド [.] (半角ピリオドはファイル名の先頭には使用出来ません)
・半角アットマーク [@]
・半角等号 [=]
・半角カンマ [,]
・半角キャレット [^]
・半角シャープ記号 [#]
・半角丸かっこ [()]
・半角中括弧 [{}]
・半角角括弧 [[]]

8.1.2 データファイルアップロード

処理環境で使用したいファイルを10Gまでアップロードできます。
※ユーザに割り当てられるディスク容量が10Gとなります。解析結果として作成されるファイルもファイルサイズとしてカウントされますので、作成ファイルが大きいとアップロードできるファイルサイズはその分小さくなります。
アップロードファイルには、以下の制限が設けられています。
項目名制限
ファイルサイズ2GB以下
ファイル全体サイズ使用するディスク容量の全体サイズが10G以下
ファイル名ファイル名に以下の文字のみ使用されている
・半角英数文字 [0-9][a-z][A-Z]
・半角感嘆符 [!]
・半角ハイフン [-]
・半角下線 [_]
・半角ピリオド [.] (半角ピリオドはファイル名の先頭には使用出来ません)
・半角アットマーク [@]
・半角等号 [=]
・半角カンマ [,]
・半角キャレット [^]
・半角シャープ記号 [#]
・半角丸かっこ [()]
・半角中括弧 [{}]
・半角角括弧 [[]]

アップロードファイルと解析結果として作成されたファイルは「データファイル一覧」欄に一覧表示されます。
「ダウンロード」アイコンを押下する事でダウンロードできます。不要なファイルは「削除」アイコンを押下することで削除できます。
・データファイルは90日間利用が無いと自動削除されます。

8.1.3 予備的処理結果ファイルコピー

サンプルセット登録で作成したオンデマンドvcfファイルを処理環境で使用したい場合はデータファイルとして登録する事で利用可能となります。「予備的処理結果ファイルコピー」欄に作成オンデマンドvcfが表示されるので、登録したいファイルにチェックを入れて「コピー」アイコンを押下してください。コピーしたファイルは「データファイル一覧」欄に表示され、以降はデータファイルとして利用可能となります。
オンデマンドvcfファイルをダウンロードしたい場合も、同様にコピー操作を行って「データファイル一覧」欄からダウンロードを行ってください。
作成オンデマンドvcfの情報を確認したい場合は「一覧」ボタンを押下すると該当データのバリアント一覧画面に遷移します。「確認」ボタンを押下するとサンプルセット登録時の登録条件が確認できます。

8.1.4 予備的処理プリセットファイルダウンロード

プリセットファイルとして登録済みのoverall.vcfがダウンロードできます。ダウンロードする際は利用規約を一読ください。

8.2 サンプルセット登録

スパコンで予備的処理を行うために抽出条件を指定したサンプルセット登録を行います。
以下の①~④を入力し、⑤を確認して、「決定」ボタンを押下するとサンプルセット名登録ダイアログが表示されます。
ダイアログで任意のサンプルセット名を登録するとスパコンへ処理リクエストを送りします。
※1度に登録可能なサンプルセットは1件です。処理中は新しいサンプルセット登録は出来ません。また登録可能なサンプルセット件数は最大10件となります。それ以上登録したい場合は不要なサンプルセットを削除してください。
スパコン側での処理状況の確認、抽出結果確認の方法は「8.3 サンプルセット一覧」を参照。

①データ抽出対象となるバイオバンクを指定します。バイオバンク指定は必須です。
 処理結果ファイルはバイオバンク毎に作成するので、バイオバンクを3つ指定すると3ファイル作成されます。
②データ抽出対象となる包含疾患とデータ抽出対象外となる除外疾患を指定します。
 具体的な疾患指定方法は「8.2.1 疾患名指定」を参照
③抽出対象となる属性を指定します。疾患か属性か抽出条件は最低1つ指定が必要です。
④抽出対象となる領域を指定します。領域指定は必須です。
 具体的な指定方法は「8.2.2 領域指定」を参照
⑤抽出条件を指定すると該当メタデータ件数が画面下部に表示されます。この指定したバイオバンクのサンプル数が10未満の場合はサンプルセット登録できませんので、条件を変更してサンプル数を10以上にしてください。

8.2.1 疾患名指定

疾患は「キーワードから探す」「疾病分類から探す」のどちらかの方法で検索・指定を行います。
①キーワードから探す
6.1.2 キーワード検索(同義語)」と同じ同義語検索で疾患名を検索して疾患指定を行う

②疾病分類から探す
表示される疾病分類の中から指定したい分類を選択して疾患指定を行う。

8.2.2 領域指定

抽出対象となる領域としてGene、refSNP、chrom、positionのいずれかを指定します。
①Gene:HIRA等を指定します。
②refSNP:rs2283354等を指定します。
③chrom、position:22:111770161等、chromの値 + “:” + positionの値を指定します。
④chrom、position範囲指定:10:71510986-71617219 等、chromの値 + “:” + positionの値(from) + “-“ positionの値(to)を指定します。

指定できるのはプリセットファイルとして登録済みのvcfファイルに含まれる値のみです。
※オンデマンドvcfはプリセットファイルの中からデータを抽出して作成しますので、プリセットファイルに存在しない値を指定した場合は抽出対象データが存在しないという事になるのでサンプルセット登録できません。

8.3 サンプルセット一覧

登録されているサンプルセットの一覧が表示されます。
サンプルセット登録画面で登録したサンプルセットの実行状況確認や、実行完了したサンプルセットについてはバリアント一覧画面に遷移して内容が確認できます。
不要になったファイルやサンプルセットの削除を行うことができます。


プリセット(基本サンプルセット)データの「一覧」ボタンを押下した場合、以下のダイアログが表示されます。
プリセットデータはデータ量が多く表示に時間が掛かる為、chromを選択しデータ範囲を絞った表示となります。
chromの選択後、「現在のタブで開く」、「新規タブで開く」のどちらかを押下するとバリアント一覧画面が表示されます。

8.3.1 表示サンプルセット

一覧にはプリセットとして事前登録されたサンプルセットと自身が登録したサンプルセットが表示されます。
・プリセットは”データ利活用プラットフォーム基本サンプルセット”という名前で表示されます。データ件数が極めて多いため、バリアント一覧画面の表示に1分以上かかります。
・作成後のファイルは30日で自動削除されます。それ以降バリアント一覧画面の表示は出来なくなります。

8.3.2 実行状況の確認

スパコンでの処理状況に応じて一覧の「ステータス」欄の表示が変わり、”登録済”になるとバリアント一覧画面の表示が可能となります。

8.3.3 サンプルセット操作

登録時の抽出条件確認や不要になったデータの「ファイル削除」「サンプルセット削除」が可能です。
・登録条件確認:抽出条件を表示します。条件表示画面の「条件を修正してサンプルセットを登録する」ボタンを押下すると、該当条件をセットした状態でサンプルセット登録画面に遷移しますので、再度サンプルセット登録を行う事が出来ます。
・ファイル削除:抽出条件などサンプルセットデータは表示されますが、バリアント一覧画面への遷移は出来なくなります。
・データ削除:サンプルセットデータ全てを削除し、一覧からサンプルセットが表示されなくなります。

8.4 バリアント一覧

サンプルセット一覧画面で選択したサンプルセットのバリアント一覧が表示されます。
・バイオバンクにバリアントが存在しない場合、Alt allele frequencyには「N/A」と表示されます。
・バイオバンクにバリアントが存在するが、サンプル数が少なく、頻度情報として扱う最小人数に達していない場合、Alt allele frequencyは「N/A(※)」と表示されます。

キーワードは以下の形式の入力で各データでのフィルタリングが可能です。
① xx:yyyyyyyyy 形式の値を入力 → chromとpositionでのフィルタリングを行います。
② xx:yyyyyyyyy-zzzzzzzzz 形式の値を入力 → chromとpositionの範囲でのフィルタリングを行います。
③上記以外 → Gene、またはrefSNPでのフィルタリングを行います。
※プリセット(基本サンプルセット)を表示中に、chromを指定してのフィルタリングを行う場合、サンプルセット一覧画面からバリアント一覧画面へ遷移する際に指定したchromと異なるchromの指定はできません。

8.5 バリアント詳細

バリアント一覧画面で選択したバリアントの詳細が表示されます。

基本サンプルセットの場合、画面最下部のFrequency一覧では、「Disease」「Gender」「Age」「Region」の各ボタンを押下するとバイオバンク毎のそれぞれの情報の表示/非表示の切り替えが行えます。


「Disease」表示中については疾患名の部分一致によるフィルタリングが行えます。

8.6 処理環境登録

Dockerイメージを指定して処理環境を起動します。
以下の①~⑥を入力し、「起動」ボタンを押下すると処理環境でDockerイメージを起動します。
※同時に使用可能なCPUは4G、メモリは28Gとなります。複数の処理環境を同時に起動する場合はこれを超えないようにしてください。
処理環境の起動状況の確認、起動したNotebookへのアクセスの方法は「8.7 処理環境一覧」を参照。

①処理環境名を入力します。
②Docker実行イメージとしてテンプレートイメージか独自イメージいずれかを指定します。
 ・テンプレート:Jupyter notebookを起動するイメージ。起動したNotebookにはブラウザからアクセスします。
 ・独自:データ管理画面で登録したユーザ自身で用意したイメージ(「8.1.1 処理環境アップロード」参照)
③独自イメージを使用する場合は独自イメージ内で利用しているユーザ名を入力します。
 利用ユーザは「root」「sys」「adm」以外の利用ユーザを入力してください。
④処理環境で使用するCPUs(1~4)を選択してください。
⑤処理環境で使用するメモリ(1GB~28GB)を選択してください。
⑥処理環境の自動停止時間(10分~300分)を選択してください。
 起動からこの時間が経過すると処理途中でも処理環境は自動で停止します。

8.7 処理環境一覧

処理環境登録画面で登録した処理環境の一覧が表示されます。
処理環境の起動状況の確認、Notebookへのアクセス、実行完了した処理環境の再起動を行うことができます。
不要になった処理環境の削除を行うことができます。

8.7.1 表示処理環境

一覧には登録した処理環境が表示されます。
解析結果のファイルをダウンロードしたい場合はデータ管理画面(「8.1 データ管理」参照)から行います。
・処理環境、解析結果として保存したデータファイルは90日間アクセスがないと自動削除されます。

8.7.2 処理環境操作

・テンプレートイメージを起動させている場合は「Notebookへのアクセス」ボタンが表示されます。このボタンを押下すると別タブで起動したNotebookにアクセスして解析操作を行う事が出来ます。
・処理環境が稼働している場合は「停止」ボタンが表示されます。このボタンを押下すると処理環境が停止します。
・処理環境が停止している場合は「起動」ボタンが表示されます。このボタンを押下すると処理環境が再起動します。
・処理環境が停止している場合は「削除」ボタンが表示されます。このボタンを押下すると処理環境を削除します。
・「コンテナログ」列の「確認」ボタンを押下すると処理環境実行時のコンテナログが確認できます。
 ログが確認できるのは処理環境が停止してからです。

8.7.3 Notebook利用時の注意点

Notebook利用時の注意点につきましては「11.3 テンプレートDockerイメージの利用手順」を参照。

9 お知らせ・ヘルプ

9.1 お知らせ

重要なお知らせを含む、お知らせを確認できます。

9.2 ヘルプ・お問い合わせ

各種マニュアル、お問い合わせ先情報が表示されます。
それぞれのボタン押下で、各種マニュアルが別タブで表示されます。

10 データ利用の申請

メニュー内の「データ利用の申請」リンクを押下する事と別タブで電子審査システムに遷移します。

11 補足

11.1 キーワード検索の検索対象項目

メタデータ検索画面でのキーワード検索において、検索の対象となる項目を以下にまとめます。
分類項目
StudyTitle
Abstract
Attributes/Value
Grants/Title
Grants/Agency
Grants/Abbr
Publications/Reference
Study Type/Study Type
ExperimentTitle
Design Description
SampleTitle
Sample Group Type
Description
Disease Name
icd_code
Attributes/Value
AnalysisTitle
Description
Attributes/Value

11.2 ユーザ作成Dockerイメージの利用手順

本章ではDockerイメージの作成手順を記載します。ここでは、利用者環境にてDockerイメージのビルド手順を記載したDockerfileとDockerが起動する際に実行されるスクリプト(entrypoint.sh)を作成し、Dockerイメージのビルドを行います。本書に記載のDockerイメージ作成を実施するには、利用者環境にDockerがインストールされている必要があります。本書では利用者側のDocker環境構築に関しては記載の対象外とします。

AMED データ利活用プラットフォームでは、利用者がDockerイメージをアップロードし、処理環境としてDockerコンテナの実行が可能ですが、実行したDockerコンテナから外部に接続すること、実行したDockerコンテナに外部から接続することを制限しています。このため、利用者が作成したDockerイメージに利用者は直接ログインすることはできません。解析処理等を含む全処理内容は、Dockerイメージ作成時に設定してください。

11.2.1 Dockerイメージ作成

①Dockerfileの作成
Dockerfileにはベースとなるイメージの指定、必要なパッケージのインストール、環境変数の設定、追加するファイル、実行するコマンド等を記載します。
Dockerfileには主に以下の命令を使用しますが、記載の注意点に従って、作成ください。

FROM
Dockerイメージのベースとなるイメージを指定します。そのためDockerfileはFROM命令から始める必要があります。
AMED データ利活用プラットフォームではLinuxベースでのDockerイメージの実行のみ可能となっています。WindowsベースのDockerイメージは利用できません。
 【書式】
 FROM イメージ名 [:タグ] 

USER
後続のRUNやENTRYPOINTの命令を実行するユーザを設定します。
AMED データ利活用プラットフォームではDockerコンテナ内でroot、sys、admは使用できません。そのため解析処理を行うENTRYPOINT、CMDの実行ユーザとしてroot、sys、admは指定できません。
 【書式】
 USER ユーザ[:グループ]  

COPY
Dockerイメージへ追加したいファイル、ディレクトリをコピー元に指定すると、Dockerイメージ上のコピー先に追加します。コピー元はビルドコンテキスト(Dockerイメージをビルドする際に使用するファイルやディレクトリのセット、本書ではビルドコマンドを実行するカレントディレクトリを指定)に存在している必要があります。
 【書式】
 COPY コピー元Dockerイメージ上のコピー先 

RUN
Dockerイメージをビルドする際に実行するパッケージインストールや、設定コマンドを記載します。
 【書式】
 RUN コマンド 

アップロードしたDockerイメージでは、Dockerコンテナ内でスクリプト等を用いて解析処理を自動実行し、その解析結果を参照可能なストレージ領域に出力すると、利用者はAMED データ利活用プラットフォームのアプリケーションを介して解析結果のファイル取得が可能です。

Dockerコンテナからストレージ領域にアクセスし、ファイルのアップロードを行えるように、Dockerfile内のRUN命令にてMountpoint for Amazon S3のインストールを指定してください。Mountpoint for Amazon S3のインストールの手順に関しては利用するLinux ディストリビューションによって異なりますので、Amazon Simple Storage Service (S3)ユーザーガイドを参照ください。

Mountpoint for Amazon S3インストールのRUN命令例 (Ubuntu利用の場合)
 # Install mount-s3
 USER root
 RUN apt-get update
 RUN apt-get install -y wget
 RUN wget https://s3.amazonaws.com/mountpoint-s3-release/latest/x86_64/mount-s3.deb 
 RUN apt-get install -y ./mount-s3.deb
 RUN rm -rf ./mount-s3.deb

ENTRYPOINT
Dockerコンテナが起動する際に実行するコマンドまたはスクリプトを指定します。
Dockerfile内に一つしか含めることができません。自動で実行する解析処理はENTRYPOINT命令や、CMD命令に記述してください。本書ではENTRYPOINTにて解析処理を指定する手順を「②Docker起動時に実行されるスクリプト(entrypoint.sh)の作成」に記載します。
 【書式】
 ENTRYPOINT コマンド 
 または

ENTRYPOINTでのスクリプト(entrypoint.sh)の指定
 ENTRYPOINT ["/usr/local/bin/entrypoint.sh"]

CMD
Dockerコンテナの起動時に指定された命令を実行します。Dockerfile内にENTRYPOINTが記載されている場合、ENTRYPOINTの引数として解釈されるので注意ください。
 【書式】
 CMD コマンド 
 または
Dockerfile全体の記載例を示します。
 FROM ubuntu

 # Install mount-s3
 USER root
 RUN apt-get update
 RUN apt-get install -y wget
 RUN wget https://s3.amazonaws.com/mountpoint-s3-release/latest/x86_64/mount-s3.deb  
 RUN apt-get install -y ./mount-s3.deb
 RUN rm -rf ./mount-s3.deb

 COPY entrypoint.sh /usr/local/bin/entrypoint.sh
 RUN chmod +x /usr/local/bin/entrypoint.sh



②Docker起動時に実行されるスクリプト(entrypoint.sh)の作成
本章ではDockerfile内のENTRYPOINTにentrypoint.shを指定し、entrypoint.shにDockerコンテナ内で実行する解析処理を記述することとします。

・解析用データファイルの利用方法
AMED データ利活用プラットフォームでは、Dockerコンテナ起動後にストレージ領域をマウントする処理を行います。
このマウント処理が完了されないとアップロードされたデータの利用やデータの保存ができません。
マウント処理が完了するまで解析処理が開始されないように、解析処理の前段に必ず待機時間(60秒)を設定してください。

マウント処理の待機指定(entrypoint.sh内)
 # Waiting for mount process 
 sleep 60s (仮) 

マウント処理が完了すると、AMED データ利活用プラットフォームのデータ管理画面からアップロードしたデータファイルはDockerコンテナの以下格納先に配置されます。(※)

データファイル格納先
 /home/[利用ユーザ(処理環境の起動時に指定)]/s3/[アップロードしたデータファイル名] 

マウントされた利用者用のストレージ領域(/home/[利用ユーザ(処理環境の起動時に指定)]/s3/)上ではデータファイルの更新、保存が保証されませんので、必ずDockerコンテナ上にデータファイルを移動してから利用ください。

データファイル利用時のコンテナ上への移動コマンド例
 cp /home/[利用ユーザ(処理環境の起動時に指定)]/s3/[利用するデータファイル名] [コンテナ上のディレクトリ] 


解析処理にて出力したファイルについては、利用者用のストレージ領域(/home/[利用ユーザ(処理環境の起動時に指定)]/s3/)に格納することで取得、保存が可能となります。(※)
利用者用ストレージ領域に格納せずに処理環境を停止(Dockerコンテナを停止)した場合、データは消失してしまい、再び処理環境を起動しても取得できません。保存したいファイルに関しては、予め解析処理のスクリプト内に利用者用ストレージ領域へ格納するコマンドを設定してください。

データファイルの格納コマンド例
 cp [コンテナ上のディレクトリ]/ [保存ファイル名] /home/[利用ユーザ(処理環境の起動時に指定)]/s3/ 

※AMEDデータ利活用プラットフォームからのデータのアップロード、ダウンロード手順に関しましては「8.1 データ管理」参照。

・Dockerコンテナの意図しない再起動の防止
解析処理の実行に関して、Dockerコンテナはメインプロセスが終了すると停止されます。
AMED データ利活用プラットフォーム上でアプリケーションからの停止操作ではなく、Dockerコンテナが自動で停止した場合、起動状態を保つためにDockerコンテナが再起動されることがあります。
そのような場合、実行された解析処理の結果が上書きされてしまうことが想定されます。意図しないコンテナの再起動を防止するため、entrypoint.shやDockerfileにて解析処理の後に、Dockerコンテナのプロセスが終了しないように命令を記述してください。Dockerコンテナの終了は必ずアプリケーションから実施してください。
解析処理終了後、Dockerコンテナの再起動を防ぐentrypoint.sh内に指定するコマンド例を以下に記載します。
Dockerコンテナの終了手順に関しては「8.7 処理環境一覧」を参照。

・Dockerコンテナの再起動を防止のためのentrypoint.shの追記例
 # 解析処理の終了

 # Execute commands to hold processes 
 tail -F /dev/null 

コンテナ起動後にコンテナ内で実行された処理の標準出力、エラー出力の状況はコンテナログにて確認できます。コンテナログを確認することで、コンテナ内の動作状況について確認することができます。コンテナログの確認手順は「8.7 処理環境一覧」を参照。

11.2.2 解析用データのアップロード、ダウンロード

本章ではアップロードしたDockerイメージを利用する場合の解析用データのアップロード、ダウンロードについて説明します。

①解析用データのアップロード
利用者がアップロードしたDockerイメージを利用して処理環境を起動する場合、Dockerコンテナからの外部接続、外部からDockerコンテナへの接続はできません。そのため利用者は実行したDockerコンテナへ直接アクセスすることができません。予めDockerイメージ作成の際に、利用するデータファイルや出力するデータファイルをスクリプト等に指定する必要があります。
データ管理画面から利用するデータファイルをアップロードします。

AMED データ利活用プラットフォームのデータ管理画面からアップロードしたデータファイルは、Dockerコンテナから見ると以下格納先に配置されます。

・データファイル格納先
 /home/[利用ユーザ(処理環境の起動時に指定)]/s3/[アップロードしたデータファイル名] 

②解析用データのダウンロード
解析処理にて出力したファイルについては、利用者用のストレージ(/home/[利用ユーザ(処理環境の起動時に指定)]/s3/)に格納することで取得、保存が可能となります。利用者用ストレージに格納せずに処理環境を停止した場合、データは消失してしまい、再度処理環境を起動しても取得できません。自動実行させるスクリプトに、保存したいファイルを利用者用のストレージに格納するコマンドを予め設定してください。

・データファイルの格納コマンド例
 cp [コンテナ上のディレクトリ]/ [保存ファイル名] /home/[利用ユーザ(処理環境の起動時に指定)]/s3/ 

処理環境上で保存したファイルがデータ管理画面のデータファイル一覧に表示されます。

11.3 テンプレートDockerイメージの利用手順

テンプレートDockerイメージを利用する場合、「8.6処理環境登録」で起動した処理環境のJupyter Notebook画面を表示、操作することが可能です。
処理環境一覧画面からWebブラウザ接続を行う処理環境の「Notebookへアクセス」ボタンを押下します。




11.3.1 解析用データのアップロード、ダウンロード

本章ではAMED データ利活用プラットフォームが用意する解析用テンプレートイメージを利用した場合の解析用データのアップロード、ダウンロードについて説明します。

①使用するデータのアップロード



②実行した処理環境へのアクセス



③Jupyter Notebook画面の表示


④アップロードファイルの確認




⑤アップロードファイルの移動
s3 フォルダ上ではデータ更新、保存が保証されませんので必ずコンテナ上に移動して利用ください。





⑥解析結果の保存
コンテナ上で出力した解析結果を取得する場合、s3フォルダに格納することで、AMED データ利活用プラットフォームアプリケーションからのダウンロードが可能となります。
s3フォルダに保存できるファイルのサイズの合計は10GBを上限としています。10GBを超過した場合、ファイルを削除しないと新たにファイルを格納できません。





処理環境上で保存したファイルがデータ管理画面のデータファイル一覧に表示されます。


11.3.2 処理環境の停止

①実行中の処理環境の確認
AMEDデータ利活用プラットフォームトップメニューから、予備的処理、処理環境一覧を選択します。


②処理環境の停止
利用が終了した実行中の処理環境について停止を選択します。
コンテナ停止の際、解析用データの格納を行わなければ、コンテナ停止に伴いデータが消失しますので、保存が必要なデータがある場合は「11.3.1解析用データのアップロード、ダウンロード」を参照ください。



12 FAQ

No質問回答
1暗証番号を忘れた場合は?暗証番号を初期化して、再度ご登録頂きます。
暗証番号の初期化をシステム管理者にご依頼ください。
2ワンタイムパスワード送信先のメールアドレスを変更したい場合は?ユーザ情報変更を行いますので、メールアドレス変更をシステム管理にご依頼ください。
3画面にスパコン接続リンクが表示されない場合は?スパコン接続が可能なのは「連携システム接続接続」のみとなります。
アクセスしているのが「連携システム接続接続」用のURLかご確認ください。
4メタデータ検索画面に古い検索条件履歴が表示されない場合は?検索条件履歴に表示されるのは直近5件分の履歴となります。それより古い履歴は表示されませんので、再度検索条件を入力し直して検索を実行ください。
5参画する研究計画プロジェクトが増えた場合は?ユーザ情報変更を行いますので、研究計画プロジェクト追加をシステム管理にご依頼ください。