データアップロード (D-way)

1 公開鍵登録
シークエンスデータをアップロードするには、DDBJのサーバーにアクセスする必要があり、アクセスするためには公開鍵認証を行わなくてはいけません。
そのためサーバー側にあらかじめ公開鍵を登録してもらう必要があります。
☞マニュアルはこちら


項目や書き方はマニュアルに記載されているので、注意点のみ書きます。

  • いよいよreadデータをアップロードするわけですが、そのためには登録する権限を取得しなくてはいけません。
    そのため“公開鍵”を登録しましょう。公開鍵作成の仕方はマニュアルに書いてあります。
    DDBJ Handbook 公開鍵/秘密鍵ペアの生成
  • 秘密鍵は “id_rsa” 、公開鍵は “id_rsa.pub”として保存されているはずなので、id_rsa.pubを登録してください。
  • Accountをクリック
    fig1
  • 一番下にあるPublic Key欄の“ファイルを選択”ボタンを押して公開鍵を選択し、Register public keyボタンで登録する。
    (登録が完了するとUpdateボタンの上に青字で、public key is registeredと表示される。)
    fig2

これで公開鍵の登録は終了です。

2 シークエンスデータのアップロード

☞マニュアルはこちら

登録できるデータ形式
BAM
Runに登録する際には、 「INSDC, refseq アクセッション番号 OR リファレンス配列 fasta」,「SN と リファレンス配列 の対応表」が必要です。
Analysis に登録する場合、後者は不要です。
BAMは圧縮する必要がありません。
将来,新しいツールで再解析や再アライメントする際に重要であるため,BAM ファイルのみを登録するときはアライメントされなかったリードを含めてください。
fastq
Quality value は phred 形式にしてください。
データ転送に時間がかかる場合には,必要に応じて fastq ファイルを gzip (.gz) もしくは bzip2 (.bz2) で圧縮してください。Bzip2のほうが圧縮率が高いですが、圧縮に4倍くらい時間がかかります。
SFF
sff ファイル中のリード名は,プレート内の位置情報とユニークな run id を反映した情報を含んでいるので,sff ファイルを書き変えないでください。
sffファイル形式はすでに最適化されており,ファイルをさらに圧縮する必要はありません。圧縮していない sff ファイルを送付してください。
sff ファイルに2つ以上のサンプルに由来するデータが含まれている場合は,sff から生成した fastq ファイルをサンプルごとに分割して登録してください。
この際タグ配列やゴミは除去した状態で送る必要があります。
DDBJ Omics Archive
Tips
シークエンスファイルの分割方法