シークエンスファイルのタグ(バーコード)分割

Off Rig

(DDBJ推奨)

sfffile -o output.sff -i list.txt input.sff


sffファイルが1つ以上のラン、もしくは1ランでも1つ以上の領域のデータを含んでいる場合は、Roche から提供されている ‘Off Rig’ ソフトウェアパッケージ中の sfffile ユーティリティを使ってファイルを適切に分割します。
ただし問題なのは 『アダプターやプライマー配列が残る』 ため、このままでは登録できません。

CutadaptやTugDustを使用してアダプター除去を行ってください。

他の方法
ソフトのご紹介(私がメタゲノム解析を手掛けることが多いので偏ってますがご了承ください^^;)

Claident [link]

(メタゲノム用解析パッケージ)

sff_extract -c input_file(SFF) : SFFファイルをFASTQに変換。
clsplitseq options inputfile(FASTQ) outputfolder
: ファイルをsplit。このときにtrimも同時に行える。

mothur [link]

(メタゲノム用解析パッケージ)

mothur “#sffinfo(sff=hoge.sff)“
 : SFFファイルをFASTQに変換。
mothur “#trim.seqs(fasta=hoge.fasta, oligos=hoge.oligos)“
 : それぞれの配列がどのサンプルかというリストを出す。
mothur “#split.groups(fasta=hoge.trim.fasta, group=hoge.groups)“
 : 上で出したリストをもとにサンプルを分割。
mothur “#make.fastq(fasta=sample1.fasta, qfile=hoge.qual)“
 : FASTAとQualityファイルからFASTQファイルを作成する。