ペアシーケンス時の方向の情報はどう使うか

 DNA で方向といえばセンス鎖、アンチセンス鎖、5’端、3’端といったワードが思いつきますが、ここでお話しするのはこれらにあまり関係がありません(全く関係ないわけではないです)。
 今回は前回に引き続き、次世代シーケンサー(NGS)にて同じ配列断片から複数個所シーケンスを行う手法についてお話します。

 同じ配列断片から複数個所シーケンスを行う手法を使うとデータ解析の時に、お互いのシーケンスデータのシーケンス方向も情報になります。

ペアシーケンスの方向とは

 同じ断片から複数シーケンスをとると、1本目のシーケンス方向に対し N 本目のシーケンスの方向は同方向、または、逆方向かといったことが考えられれます。
 アライメント計算ツールを使う際に、2本ペアのシーケンスアプリケーションによるシーケンスデータに対応している場合、方向の設定をオプションで指定する時があります。その際によく見る設定値は fr(forward-reverse)、ff(forward-forward)、rf(reverse-forward)です。
これはペアの方向の関係性をあらわしています。

設定値 シーケンスの方向関係
(「–」シーケンス、「>/<」方向、「=」配列)
fr ––––>        <––––
============
ff ––––>        ––––>
============
rf <––––        ––––>
============

 fr と rf の違いは、前者が断片の内側に向かってシーケンスされている、後者が逆に外側に向かってシーケンスしているかの違いになります。(ツールによっては独自の設定がある可能性があるため、よく確認する必要があります。)

方向がどんな役に立つのか

 リファレンスに対しマッピングする際に、ペアのリードの方向関係がオプションの設定に一致すると、スコアを上げるなどの計算の補正に情報が使われます。その他にも、このマッピング情報を使って、リファレンスに対し設定と異なる方向関係でアライメントが行われていたら、逆位が考えられます。また、前回もお話した転座などでも境目の予測に使うことができます。

シーケンスアプリケーションの方向の例

 シーケンサーによってロジックが異なるので Paired-End イコール fr の方向ではありません。

シーケンサー アプリケーション 方向
Illumina MiSeq Paired-End fr
Illumina MiSeq Mate Pair rf
Ion Torrent Paired-End fr
Ion Torrent Mate Pair rf
Roche 454 Paired-End ff