SureCall v3.0 基本操作説明書 (2015年7月版) Research Use Only.

SureCall v3.0 基本操作説明書 (2015年7月版) Research Use Only.
SureCall v3.0
基本操作説明書
(2015年7月版)
Research Use Only.
Not for use in Diagnostic
Procedures.
はじめに
SureCall とは?
・Agilent TechnologiesのSureSelect (DNA), HaloPlexでターゲットエンリッチメントを行ったサンプ
ルの解析専用のソフトウェアで、Agilent Technologiesから無償で配布しています。ヒトゲノムの
みを対象にしています。ミトコンドリアゲノムには対応していません。ヒト以外の各種モデル生
物のSureSelectには対応していません。
・シーケンサ付属ソフトから出力されるFASTQファイル、またはアライメント済みのBAMファイル
を使用可能です。ゲノム配列へのアライメント(FASTQファイルから始める場合)、変異の同定、
各種情報の付与を行い、Mutation TableとGenome Browserで見やすく表示します(下図参照)。
・本ソフトウェアの動作にはインターネットへの接続が必要です。
・予期せぬ不具合がある可能性があります。お気づきの点は [email protected]までご
連絡ください。不具合は見つかり次第、本社に報告し改善要求を出します。
このガイドでは、SureCallの基本的な使い方を説明しています。
ソフトウェアのインストールについては、別途インストールガイドをご参照ください。
詳細はSureCallソフトウェア付属のヘルプをご参照ください。
また、本ガイドと同じ内容をビデオでご覧いただくこともできます(英語ナレーション)。
http://www.genomics.agilent.com/GenericB.aspx?pagetype=Custom&subpagetype=Custom&pagei
d=3362
2
もくじ
解析を始める前に
p.4
SureDesign登録情報の追加
p.6
デザインファイルのダウンロード
p.8
トラックの追加とKnown Variantの追加
p.12
解析メソッドについて
p.20
シーケンスデータの解析
(Single, Pair, Trio解析)
p. 33
Triage Viewによるデータの確認
(Single, Pair, Trio解析)
p. 47
レポート機能
p. 58
(Single, Pair, Trio解析)
OneSeq解析のワークフロー
p. 66
Reference
p. 86
3
解析を始める前に
必ずお読みください
SureCallをお使いいただくために、以下の点にご注意ください。
・アライメントを行っていないFASTQファイルからSureCallで解析を行う場合、SureCallのほかに
GenAlignerのインストールが必要です。GenAlignerもアジレントから無償で提供しています。詳
しくは、インストールガイドをご参照ください。FASTQからの解析はイルミナプラットフォームのみ
の対応です。Ion PGMのデータの場合はTorrent Server等でアライメントを行ったBAMファイル
を使用します。
・SureCallでの解析には、SureSelectもしくはHaloPlex ターゲットエンリッチメントのデザインファ
イルが必要です。デザインファイルはSureCallから、お使いのSureDesignアカウントに直接アク
セスすることでダウンロードできます。詳しくは p 6からをご参照ください。
・インターネットに接続した環境でご使用ください。オフラインでは解析がエラーになります。
・FASTQファイルから解析を行う場合、FASTQファイルと同じフォルダに、アダプター除去された
FASTQファイル、アライメント済みのBAMファイルが作成されます。十分に空き容量があること
をご確認ください。
・variant callの結果のVCFファイルは、各jobごとのjob folderに保存されます。
SureCallをインストールしたフォルダ\Server\CommonStrage\WorkflowOutput\
上記フォルダの中に、各jobのフォルダが作成されます。
・SureCallのviewerは、最初に指定したファイルの場所を参照しています。BAMファイルなどを
移動すると結果が表示できなくなりますのでご注意ください。
・Variant Callerとして、BAQおよびSNPPET (自社開発)の2種類を備えています。SNPPETはより
頻度の低いvariantの検出にも対応しており、SureCall v2.1ではSNPPETをDefaultに使っていま
す。
・SureCallは次の領域を対象にVariant Callを行います。
SureSelect XTおよびSureSelect QXT: プローブでおおわれたcovered領域±100 bp
HaloPlex: Target領域のうち、Covered領域に含まれる領域 (※ただし、現バージョンでは
SNPPETを使用する場合、領域の最後のポジションはHOMのvariant以外Variant Callの
対象になりませんのでご注意ください。 )
・Defaultではリード数x40以上の領域でvariant callを行います。 この値は変更可能です。変更
する場合は p27 をご参照ください。
・Defaultでは存在比0.1 (10%)以上でvariant callを行います。この値は変更可能です。変更す
る場合は p 28 をご参照ください。
<続く>
4
・SureCall v3.0では、分子バーコードつきHaloPlex HSのデータ解析に対応しました。
HaloPlex HSの解析を行う際、イルミナプラットフォームのデータとIon PGMのデータで扱い
が大きく異なります。P35の注意点をご参照ください。
5
SureDesign登録情報の追加
SureCallでは、SureDesignからダウンロードしたデザインファイルに基づいて解析を行います。
したがって、SureCallでの解析を行う前に、SureDesignのアカウント情報を追加する必要があり
ます。
1. SureCallのHome画面からSureDesign Setting画面に移動します。
a. プログラムのウィンドウから、Adminをクリックします。
b. 画面左側から、SureDesign Settingsをクリックします。
6
2. SiureDesignアカウントのユーザーネーム、パスワードを入力します。
SureDesignではユーザーネームはe-mailアドレスです。
3. ユーザーネーム、パスワードを入力したら、Apply をクリックします。
4. 次に Test Connection をクリックして、SureDesignの登録情報が正しく設定されたかどう
かを確認します。
SureDesignに正しく接続できると、下記のメッセージが表示されます。
SureDesignに接続できなかった場合、下記のメッセージが表示されます。
SureDesignに接続できなかった場合は、SureDesignのウェブサイト
www.agilent.com/genomics/suredesign
にアクセスしてログインをお試しください。
こちらでログインできなかった場合には、パスワードをリセットするか、もしくは新たなアカ
ウントを登録することが出来ます。リセットしたパスワードあるいは新たなアカウントで、再
度設定してください。
7
デザインファイルのダウンロード
1. SureCallのHome画面からSureDesign Setting画面に移動します。
a. プログラムのウィンドウから、Supporting Files をクリックします。
b. 左のバーからDesignを選択すると、ダウンロード済みのデザインファイルが表示され
ます。新たにデザインファイルをダウンロードするには、Download New をクリックし
ます。
8
2. 必要なデザインファイルをダウンロードします。
a. Download New をクリックすると、SureDesignで作成済みのデザインと、アジレントの
カタログデザインのデザインファイル一覧が表示されます。
b. デザインファイルの数が多い場合には、赤枠の検索ボックスにデザインの名前やID
を入力することで、検索することができます。
c. ダウンロードするファイルにチェックを入れます。複数のデザインを選択して一度に
ダウンロードすることもできます。
d. すべて選択したら、Download をクリックします。
デザイン
名
デザイン
ID
9
3. バックグラウンドでダウンロードが開始されます。
a. 下記メッセージが表示され、デザインのダウンロードが開始されます。
b. OK をクリックしてダイアログボックスを閉じます。
c. Supporting Files 画面で、ダウンロードしたデザインが追加されています。
インポートが終了すると、Design Import Statusが”Import Successful”となり、解析に使用
できるようになります。SureCall v1.0ではこの後にアノテーションのダウンロードが行われ
ましたが、v1.1以降のバージョンではアノテーションのダウンロードはデータ解析時に行
われる仕様に変更されました。
10
4. デザインファイルの内容確認
a. インポートしたデザインを選択すると、右側に情報が表示されます。 Design
Properties にはデザインIDやアノテーション更新日の情報が記載されています。
注意
 必ず、インポートしたデザインファイルはDesign Propertiesを確認し、Design Typeが目
的のタイプと一致するか確認して下さい。
 HaloPlexHS のデザインファイルのダウンロードは、必ずSureCall v3で行って下さい。
2.1以前のバージョンでダウンロードすると、Design TypeがHaloPlex デザインとして
インポートされてしまいます。
b. Design Detailsにはターゲットとしているゲノム領域情報などが表示されます。Design
Detailsタブでは、詳細を表示するトラックを選択できます。
11
トラックの追加とKnown Variantの追加(Option)
SureCall v3.0 では、TrackまたはKnown Variantを追加して、カスタムアノテーションを追加したり、
一部の領域だけを解析対象に指定することができます。
 Track based annotation 機能:ゲノムの位置情報とアノテーションを記載したTrackを追加し、
SureCallが検出したvariantにオリジナルのアノテーションを追加できます。
 Track based filtering機能:ゲノムの位置情報とアノテーションを記載したTrackを追加し、Track
で定義された領域だけを対象に解析を行うfilteringができます。
 Known Variant機能:既知のvariantの位置情報・アノテーションを記載したKnown Variantファ
イルを追加し、SureCallが検出したvariantがKnown Variantに含まれるかどうか、またKnown
Variantが見つかったかどうかをレポートできます。
Track based annotation, Track based filtering機能を使うためには、あらかじめTrackを追加する必
要があります。また、Track based annotation、Track based filteringを使用する場合、Methodの
変更が必要となります。P22 も併せてご参照ください。
注意
 Track based annotation, Track based filtering は領域の設定方法がBED 形式になりますが、
Known Variant機能は領域の設定方法が現時点では異なります。それぞれの項目を参照し、
目的に適した領域設定・形式のファイルを作成してください。
 非常にサイズの大きなファイルを指定すると、Import後の読み込みに非常に時間がかかる
場合があります。数分間ソフトウェアが無反応でもそのまま待ってください。
12
トラックの追加 (Track based annotation、Track based filteringとして
使用できます)
1. SureCallのHome画面からSureDesign Setting画面に移動します。
a. プログラムのウィンドウから、Supporting Files をクリックします。
b. 左のタブから、Tracksを選択します。新たにTrackを追加するにはAdd Newをクリックし
ます。
2
ファイルを選択し、Uploadします。
13
ファイルの形式は、annotation で使用する場合も、指定領域だけを解析するfilteringで使用する
場合も共通のbedフォーマットとなります。
いったんアップロードしたTrackは、annotation、filteringの両方に使用可能です。
UCSC bedフォーマット (start:0-based, stop: 1-based)
染色体番号、スタート、ストップ、コメントの4カラムをタブで区切って記述します。
Chr: 染色体 X, Yは大文字を使用します。
Start:スタートポジション、0-basedで記述(bed フォーマット)
Stop:ストップポジション、1-basedで記述(bed フォーマット)
Comments: コメント、アノテーション
先頭に#を付けるとヘッダー行として認識されます。
ヘッダー行は入れなくても構いません。
例)
#Chr Start
Stop
Comment
chr4 55152039
55152040
PDGFRA_CtoT
をインポートした場合
•
Track based annotation として使用する場合
Stop に入力した位置番号にアノテーションがつきます。
chr4の55152040にアノテーションが付きます。
14
•
Track based filtering として使用する場合
chr4 の 55152040 が検出対象になります。
Track based filtering の Track
14
3, 選択したファイルの形式に問題がなければValidと表示されるのでOKをクリックします。
Validにならない場合、ファイルの形式を見直してください。
すぐにTrack Importing Completedと表示されるのでOKをクリックします。
4,
追加したTrackを選択し、Track Detailsタブをクリックすると、内容を確認できます。
5,
追加したトラックを消去したい場合
Trackのタブから消去したトラックを選択し、delete ボタンを押します。
確認画面になりますので、Yes ボタンを押します。
15
Known Variantsの追加
SureCall v2.1では、既知のvariantをまとめたKnown Variantsファイルをアップロードし、解析する
際にKnown Variantsに当てはまるかどうかの判定に使うことができます。Single Analysisのみに
対応しています。Known Variantsを使用するためには、あらかじめファイルをアップロードして
おく必要があります。
1. SureCallのHome画面からSureDesign Setting画面に移動します。
a. プログラムのウィンドウから、Supporting Files をクリックします。
b. 左のタブからKnown Variantsを選択します。
新たにKnown Variantsを追加するにはAdd Newをクリックします。
16
2
ファイルを選択し、Uploadします。
ファイルの形式は、6カラムのtab区切りtxtファイルです。必ず次の6カラムを含めます。
Chr: 染色体 X, Yは大文字を使用します。
Start:スタートポジション、1-basedで記述(bed フォーマット+ 1 bp)
Stop:ストップポジション、2-basedで記述(bed フォーマット+ 1 bp)
Allele: Variant Alleleを記載 (Refは記載する必要がありません)
Type: SNP, Insertion, Deletion のいずれかを記載
Comments: コメント \nをはさむことで改行も可能です。必ず何かコメントを入れます。
例 chr7: 55249063 Alt Allele A, SNP, rs1050171
という内容
#Chr
Start
Stop
Allele
Type
chr7
55249063
55249064
A
SNP
(1行目の先頭に#を追加すると、ヘッダー行として認識されます。)
もしくは
chr7
55249063
55249064
A
(ヘッダー行の記載なしでも、後から選択できます。)
SNP
Comments
rs1050171
rs1050171
17
3, 選択したファイルの形式に問題がなければImport Variant Site画面が表示されます。
Importしたファイルの先頭行にHeaderを含めた場合、割り当てが正しいかどうかを確認します。
Header 行を含めなかった場合は、各カラムについて対応するHeaderを割り当て、OKをクリック
します。
4、 Known Variants のインポート完了のメッセージが表示されます。
5、 Known Variants Detailsタブで内容を確認できます。
6、 追加したKnown Variants をエキスポートしたい場合
エキスポートしたいファイルを選択、Export をクリックします。
18
18
保存先を指定して、Saveを押します。
File format は.BED となっていますが、実際はインポート時と同じ形式で領域が表示されますの
でご注意下さい。
Start:スタートポジション、1-basedで記述(bed フォーマット+ 1 bp)
Stop:ストップポジション、2-basedで記述(bed フォーマット+ 1 bp)
となります。
7, 追加した known variant ファイルを消去したいとき
消去したいファイルを選択し、Deleteを押します。
確認画面になりますのでYes を押して消去します。
Known Variant File がanalysis workflow で使用されている場合は消去できないため、その場合
は使用しているデータを消去してからdeleteします。
19
解析メソッドについて
SureCallでは、SureSelect XT, SureSelect QXT, HaloPlex のそれぞれの解析条件に合わせた
Default Methodがあらかじめ登録されています。
Single Sample Analysis
 Default HaloPlex Method
 Default SureSelect Method
 Default SureSelect QXT Method
Pair Analysis
 Default HaloPlex Tumor Normal Method
 Default SureSelect Tumor Normal Method
 Default SureSelect QXT Tumor Normal Method
 Default HaloPlex Copy Number Method
 Default SureSelect Copy Number Method
 Default SureSelect QXT Copy Number Method
Trio Analysis
 Default HaloPlex Trio Method
 Default SureSelect Trio Method
 Default SureSelect QXT Trio Method
OneSeq CNV and Mutation nalysis
 Default OneSeq Backbone CN
 Default OneSeq Full Design CN
Methodは次の各項目についての設定を行っています。
 QC Metrics
 Alignment
 Trimmingの有無
 使用するAlignerの種類
 Post Alignment Processing
 Duplicate除去の有無
 Region Padding
 SNP Callerの設定
 Filter
 Mutation Impact (カテゴリーわけの基準)
 Version of Annotations
 Track Based Annotation (Option)
20
赤字で示した3項目について、HaloPlex, SureSelect, SureSelect QXTでキットの特
性にあわせて下表のようにDefaultで設定されています。
HaloPlex
SureSelect
SureSelect QXT
Trimmer
Yes
No
Yes
Remove Duplicates
No
Yes
Yes
Region Padding
No
Yes - 100 bp
Yes - 100 bp
共通するパラメータとしては、代表的なものとしては下記のようにDefault設定されていま
す。
 Read Depth: Point Mutationについては40x, InDelについては0x以上のリードが
ある 部分でコールします。Filter項目で設定されています。
 Minimum Allele Frequency:0.1 (10%)以上のFrequencyがあればコールします。
SNPPET SNP Caller項目で設定されています。
これらの条件を変更して、新しいMethodを作成することも可能です。
21
解析メソッドの作成
SureCallでは、デフォルトで設定されている解析メソッドに加えて、カテゴリー分類や各種パ
ラメータを変更して新しい解析メソッドを作成することができます。ここでは、5つの例を紹介
します。
1、日本人SNP頻度データのトラックを追加する
2、リード数によるフィルタおよびMinimum Allele Frequencyを変更する
3、SNP Callerを変更する
4、カテゴリー分類を変更する
5、CNV解析の設定を変更する
22
1. 日本人SNP頻度データのトラックをアノテーションに追加する
日本人 1,208 名分のエクソーム解析および3,248 名分のコホート解析から得られた、日本人
のGenetic VariationとCommon VariationのGenotypingのデータベースが京都大学の”Human
Genetic Variation Browser (http://www.genome.med.kyoto-u.ac.jp/SnpDB/index.html)”にて公開
され、ダウンロードも可能になっています。
このデータベースから頻度情報を計算し、SureCallにアップロード可能なbed形式にするツール
が下記のWeb siteより、利用可能です。またこのWeb siteからbedファイルをダウンロードするこ
とも可能です。(長崎大学 三嶋 博之先生 開発)
https://github.com/misshie/hgvd2annovar
a. bedファイルを保存します。
b. SureCallにbedファイルを”Track”として追加します。Supporting Filesタブの中でTracks
を選択します。
c. Add Newボタンをクリックすると、ファイル選択画面が表示されるので、カスタムトラッ
クとして追加したいbedファイルを指定します。
注意:ファイルサイズが非常に大きいため、Importには時間がかかります。Importボタンを
クリックしてから数分間、PCが反応しない場合がありますが、そのままお待ちください。
23
d. インポートされたファイルの内容を確認します。該当するbedファイルを選択した状態
でTrack Detailタブに移動すると、インポートしたファイルの内容が確認できます。
e. 追加したトラックをアノテーションに取り込むように解析メソッドを変更します。
Configure Settingsタブの中でAnalysis Methodを選びます。初期状態では、各種
Default Methodが表示されます。使用したいメソッドを選び、Track Based Annotation
をクリックします。Select Trackのプルダウンボックスに、これまでに取り込んだTrack
の名前が表示されるので、アノテーションに使用したいTrackを選択します。
24
f. Analysis Methodを変更すると、Save Asボタンがアクティブになります。適切な名前を
付けて、Methodを保存します。このようにして、条件を変更して作成したメソッドは、
Analysis Workflowで指定することができるようになります。
g. Triage Viewで確認します。追加したCustom Annotation TrackはMutation Tableの右
端に追加されています。
25
2. リード数のフィルタ、Minor Allele Frequencyの下限を変更する
a. Configure Settingタブから、変更したいメソッドを開きます。
b. Filterをクリックします。DefaultではRead Depthは40以上のところを解析する設定に
なっています。この下限を変えたい場合には、Read Depthボックスに適切な数字を
入力します。
26
c. 検出するMinimum Allele Frequencyを変更する場合は、SNPPET SNP Callerをクリック
します。Defaultでは0.1になっているので、0.01-1.0の間の適切な数字を入力します。
Homozygous, Heterozygousの2つのフィルターに別れていますが、現バージョンでは
いずれかのフィルターに入力した値のうち、より低い値が両フィルターの設定値と
して反映されます。
例: Homozygous: 0.1, Heterozygous: 0.7 で設定した場合、0.1が両フィルターの
設定値としてフィルターがかかります。
d. Analysis Methodを変更すると、Save Asボタンがアクティブになります。適切な名前を
付けて、Methodを保存します。このようにして、条件を変更して作成したメソッドは、
Analysis Workflowで指定することができるようになります。
27
3. SNP Callerを変更する
SureCall v3.0では、アジレントが開発したSNPPET SNP CallerをDefaultでは使用しています。
一般的によく使用されるSamToolsのBAQ Callerを選択することも可能です。
a. Configure Settingタブから、変更したいメソッドを開きます。
b. SNP CallerからBAQ SNP Callerを選択します。
c. Analysis Methodを変更すると、Save Asボタンがアクティブになります。適切な名前を
付けて、Methodを保存します。このようにして、条件を変更して作成したメソッドは、
Analysis Workflowで指定することができるようになります。
28
4. カテゴリー分類基準の変更
a. Configure Settings - Categorization を開きます。
b. 左側の枠に現在保存されているCategorizationが表示されます。
変異の特徴(Stopコドン、COSMIC登録あり、など)が各カテゴリーに割り振られていま
す。
c. 変更する場合は、別のカテゴリに移したい項目を選択し、左向きの矢印をクリックし
ます。中央の Unused attributesに移動します。
29
d. 次に、Unused attibute内の項目を選択し、その項目を追加したいカテゴリーの横に
ある右向き矢印をクリックすると、そのカテゴリーに項目が移動します。
e. カテゴリー自体を削除したい場合はカテゴリ名の横のボタンをクリックします。該当
のカテゴリに割り当てられていた項目がすべて Unused attributesに移動するので、
残っている別のカテゴリに割り当てます。不要な項目はUnused attributesに残したま
まにすることもできます。
f. Save Asをクリックし、名前をつけて保存します。
30
g. Configure Settings - Analysis Methods を開きます。
h. 左側の枠に現在保存されている解析メソッドが表示されます。中央の枠内には、解
析の流れに沿ったステップが表示され、クリックすると設定されているパラメータが
右側の枠内に表示されます。
i.
カテゴリ分類を変更したい場合は、Mutation Impactをクリックします。Categorization
Nameから、作成したCategorizationを選択します。
j.
Analysis Methodを変更すると、Save Asボタンがアクティブになります。適切な名前を
付けて、Methodを保存します。このようにして、条件を変更して作成したメソッドは、
Analysis Workflowで指定することができるようになります。
31
5. CNV解析のパラメータ変更
a. Configure Settings – Analysis Method を開きます。
b. 左側の枠に現在保存されているMethodが表示されます。
Default SureSelect/SureSelect QXT/HaloPlex Copy Number Methodを開きます。
CNVコールに関連するパラメーターはCNV Callにまとめられています。
平均エクソンサイズに合
わせたWindow サイズが
Defaultになっていますが
1-1000の範囲で変更でき
ます。
CNVとコールするための
Log Ratio基準値も変更で
きます。
c. 必要に応じて数値を変更し、メソッドに名前を付けて保存します。
32
シーケンスデータの解析(Single, Pair, Trio解析)
1. SureCallのHome画面からAnalysis Workflow 画面に移動します。
a. プログラムのウィンドウから、Analysis Workflow をクリックします。
b. Analysis Workflow画面が表示されます。
c. まず、解析タイプをSingle Analysis, Pair Analysisから選択してNextをクリックします。
d. シーケンスデータを指定します。SureCallでは、シーケンスプラットフォーム、により使
用できるファイルが異なります。
Illumina:アライメントを行っていないFASTQファイル、または他のツールで
アラインメントを行ったBAMファイルを用いることができます。ただしHaloPlex HS
データでmolecular barcode 情報を反映させるためには、 FASTQファイルが必要
です。詳細は次項目、2-1. HaloPlex HS Analysis をご参照下さい。
IonPGM: Torrent Serverでアライメント済みのBAMファイルを使用する必要が
あります。
33
2-1. HaloPlex HS Analysis
シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
HaloPlex HS 解析時の注意点
• Illumina シーケンスデータを取り込む場合、Molecular Barcode 情報を結果に反映させるため
には、必ずアライメントしていないFASTQファイルを使用する必要があります。必要なファイル
は、 Read1 (R1)、 Read 2 (R2)に加え、molecular barcode の情報であるindex2 (I2) のファイル
が必要です。
詳細はHaloPlex HS ターゲットエンリッチメントシステム プロトコル イルミナシーケンシング
対応キットのSTEP9 以降をご参照下さい。
• IonPGM シーケンスデータの場合、現バージョンのSureCallはIon Torrent data のアライメント
に対応していないため、Torrent Serverrでアライメント済みのBAMファイルを使用する必要が
あります。
※次ページからそれぞれの方法について詳しく解説しています。
Illumina シーケンスデータの場合
IonPGM シーケンスデータの場合
34
 Illumina シーケンスデータの場合:
Molecular Barcode 情報を結果に反映させるためには、必ずアライメントしていない
FASTQファイルを使用する必要があります。
a. Analysis workflowでSingle Analysis を選択します。
b. Import Unaligned をクリックします。ダイアログボックスが開くので、FASTQファイルを
指定します。Browseボタンをクリックして一覧から選択することができます。
c. Read1 (R1)、 Read 2 (R2)、molecular barcode の情報であるindex2 (I2) のファイルを選
択してAddをクリックします。
インポートするファイルはFASTQ形式です。ZIP化されたファイル(拡張子が .gz)でもそ
のままインポートすることができます。続けて次のデータを指定することもできます。
ひとつのワークフローの中で複数組のデータの解析を指示することができますが、
AlignedとUnalignedを混在させることはできません。
スマートセレクション機能がONになっている場合、3つのFASTQファイルが同じフォルダ内に存在する
とワンクリックで3ファイルをまとめて選択できます。この機能は、3つのファイル名の末尾にそれぞれ
xxxx_R1.fastq, xxxx_R2.fastq, xxxxI_I2.fastq と正しく入力され、且つ直前のファイル名が同一の場合
に機能します。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: デフォルトでは、Default HaloPlex Methodを選択します。
パラメータを変更したMethodを作成した場合は、適切なものを選択します。
Design:インポート済みのデザインから選択します。必ず事前にDesign Typeが
HaloPlex HSであることを確認してください。確認方法はデザインファイルのダウン
ロードの項目をご参照下さい。
Platform: Import Unaligned を選択した場合、自動的に Illumina になります。
35
Known Variants (Option): 必要に応じて追加したファイルから選択します。
 IonPGM シーケンスデータの場合:
SureCall ver3.0はIon Torrent data のアライメントに対応していないため、
Torrent Serverでアライメント済みのBAMファイルを使用する必要があります。
a. Import Aligned をクリックします。ファイル選択のダイアログボックスが開くので、解
析するBAMファイルを選択します。
b. 指定したファイルが入った状態になります。続けて次のデータを指定することもでき
ます。ひとつのワークフローの中で複数組のデータの解析を指示することができま
すが、AlignedとUnalignedを混在させることはできません。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: デフォルトでは、Default HaloPlex Methodを選択します。
パラメータを変更したMethodを作成した場合は、適切なものを選択します。
Design:インポート済みのデザインから選択します。 必ず事前にDesign Typeが
HaloPlex HSであることを確認してください。確認方法はデザインファイルのダウン
ロードの項目をご参照下さい。
Platform: Ion Torrentを選択します。
Known Variants (Option): 必要に応じて追加したファイルから選択します。
36
2-2a Single Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメントしていないFASTQファイルを使用する場合
Illumina HaloPlex HS データ のインポート方法は35ページを御覧ください。
SureCall ver3.0はIon Torrent data のアライメントに対応していないため、IonPGM データは
Torrent Serverでアライメント済みのBAMファイルを使用する必要があります。
a. Import Unaligned をクリックします。ダイアログボックスが開くので、FASTQファイルを
指定します。Browseボタンをクリックして一覧から選択することができます。Read 1、
Read 2のファイルを選択してAddをクリックします。
インポートするファイルはFASTQ形式です。ZIP化されたファイル(拡張子が.gz)でもそ
のままインポートすることができます。
スマートセレクション機能がONになっている場合、2つのFASTQファイルが同じフォルダ内に存在する
とワンクリックで2ファイルをまとめて選択できます。この機能は、2つのファイル名の末尾にそれぞれ
xxxx_R1.fastq, xxxx_R2.fastq,と正しく入力され、且つ直前のファイル名が同一の場合に機能します。
b. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、SureSelect, SureSelect QXT、HaloPlexのそれぞれに
ついてデフォルトのAnalysis Methodが入っています。ターゲットエンリッチメントに用
いたキットに応じて選択します。パラメータを変更したMethodを作成した場合は、適
切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform: Import Unaligned を選択した場合、自動的に Illumina になります。
Known Variants (Option): 必要に応じて追加したファイルから選択します。
37
2-2b Single Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメント済みBAMファイルを使用する場合
Ion PGM HaloPlex HS データ のインポート方法は36ページをご参照下さい。
SureCall ver3.0はIon Torrent data のアライメントに対応していないため、IonPGM データは
Torrent Serverでアライメント済みのBAMファイルを使用する必要があります。
a. アライメント済みのBAMファイルを用いる場合、Import Aligned をクリックします。ファ
イル選択のダイアログボックスが開くので、解析するBAMファイルを選択します。
b. 指定したファイルが入った状態になります。続けて次のデータを指定することもでき
ます。ひとつのワークフローの中で複数組のデータの解析を指示することができま
すが、AlignedとUnalignedを混在させることはできません。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、SureSelect, SureSelect QXT、HaloPlexのそれぞれに
ついてデフォルトのAnalysis Methodが入っています。ターゲットエンリッチメントに用
いたキットに応じて選択します。パラメータを変更したMethodを作成した場合は、適
切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform:シーケンシングに使用したプラットフォーム(IlluminaまたはIon Torrent)を選
択します。
Known Variants (Option): 必要に応じて追加したファイルから選択します。
38
2-3a Pair Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメントしていないFASTQファイルを使用する場合
a. Import Unaligned をクリックします。ダイアログボックスが開くので、FASTQファイルを
指定します。Read 1、Read 2のファイルを選択してAddをクリックします。Reference,
Sampleそれぞれについて指定します。
インポートするファイルはFASTQ形式です。ZIP化されたファイル(拡張子が .gz)でもそ
のままインポートすることができます。
スマートセレクション機能がONになっている場合、2つのFASTQファイルが同じフォルダ内に存在する
とワンクリックで2ファイルをまとめて選択できます。この機能は、2つのファイル名の末尾にそれぞれ
xxxx_R1.fastq, xxxx_R2.fastq,と正しく入力され、且つ直前のファイル名が同一の場合に機能します。
b. 続けて、次のデータを指定することもできます。ひとつのワークフローの中で複数組
のデータの解析を指示することができますが、AlignedとUnalignedを混在させること
はできません。
b. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、Pair Analysis用にSureSelect, SureSelect QXT、
HaloPlexのそれぞれについて、Tumor Normal Method, Copy Number Methodのデ
フォルトのAnalysis Methodが入っています。ターゲットエンリッチメントに用いたキット
と解析の目的に応じて選択します。パラメータを変更したMethodを作成した場合は、
適切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform:シーケンシングに使用したプラットフォーム(Illumina)が選択された状態に
なっています。
39
2-3b Pair Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメント済みBAMファイルを使用する場合
a. アライメント済みのBAMファイルを用いる場合、Import Aligned をクリックします。ファ
イル選択のダイアログボックスが開くので、解析するBAMファイルを選択します。
Reference, Sampleについてそれぞれファイルを指定します。
b. 指定したファイルが入った状態になります。続けて次のデータを指定することもでき
ます。ひとつのワークフローの中で複数組のデータの解析を指示することができま
すが、AlignedとUnalignedを混在させることはできません。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、Pair Analysis用にSureSelect, SureSelect QXT、
HaloPlexのそれぞれについて、Tumor Normal Method, Copy Number Methodのデ
フォルトのAnalysis Methodが入っています。ターゲットエンリッチメントに用いたキット
と、解析の目的に応じて選択します。パラメータを変更したMethodを作成した場合
は、適切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform:シーケンシングに使用したプラットフォーム(IlluminaまたはIon Torrent)を
選択します。
40
2-4a Trio Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメントしていないFASTQファイルを使用する場合
a. Import Unaligned をクリックします。ダイアログボックスが開くので、FASTQファイルを
指定します。Read 1、Read 2のファイルを選択してAddをクリックします。Child, Mother,
Father それぞれいついて指定します。
インポートするファイルはFASTQ形式です。ZIP化されたファイル(拡張子が .gz)でもそ
のままインポートすることができます。
スマートセレクション機能がONになっている場合、2つのFASTQファイルが同じフォルダ内に存在する
とワンクリックで2ファイルをまとめて選択できます。この機能は、2つのファイル名の末尾にそれぞれ
xxxx_R1.fastq, xxxx_R2.fastq,と正しく入力され、且つ直前のファイル名が同一の場合に機能します。
b. 続けて、次のデータを指定することもできます。ひとつのワークフローの中で複数組
のデータの解析を指示することができますが、AlignedとUnalignedを混在させること
はできません。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、Pair Analysis用にSureSelect, SureSelect QXT、
HaloPlexのそれぞれについて、デフォルトのAnalysis Methodが入っています。ター
ゲットエンリッチメントに用いたキットと解析の目的に応じて選択します。パラメータを
変更したMethodを作成した場合は、適切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform:シーケンシングに使用したプラットフォーム(Illumina)が選択された状態に
なっています。
41
2-4b Trio Analysis シーケンスデータ・解析メソッド・デザインファイル・プラットフォームの指定
:アライメント済みBAMファイルを使用する場合
a. アライメント済みのBAMファイルを用いる場合、Import Aligned をクリックします。ファ
イル選択のダイアログボックスが開くので、解析するBAMファイルを選択します。
Child, Mother, Father についてそれぞれファイルを指定します。
b. 指定したファイルが入った状態になります。続けて次のデータを指定することもでき
ます。ひとつのワークフローの中で複数組のデータの解析を指示することができま
すが、AlignedとUnalignedを混在させることはできません。
c. 次に、Analysis Method, Design, Platformを選択します。
Analysis Method: SureCall には、Pair Analysis用にSureSelect, SureSelect QXT、
HaloPlexのそれぞれについて、デフォルトのAnalysis Methodが入っています。ター
ゲットエンリッチメントに用いたキットと、解析の目的に応じて選択します。パラメータ
を変更したMethodを作成した場合は、適切なものを選択します。
Design:インポート済みのデザインから選択します。
Platform:シーケンシングに使用したプラットフォーム(IlluminaまたはIon Torrent)を
選択します。
42
3. 指定したファイル、Analysis Method, Design, Platformを確認します。
a. 前の画面で指定した組み合わせを確認します。この段階で変更することも可能です。
b. Next をクリックします。
4. サンプル名の入力
a. Sample Nameフィールドにサンプル名を入力します。サンプル名にはハイフン(-)、
プラス(+)等の特殊文字は使用できません。サンプルの性別がわかっている場合に
はGenderを選択します。
43
5. サマリーを確認し、解析を始めます。
a. Job Nameをこの段階で変更することができます。
また、必要に応じてDescriptionを追加します。
b. Run Analysisをクリックします。
c. SureCallの画面は自動的にSample Reviewに切り替わります。Statusに現在のサンプ
ルの状況が表示されます。複数のジョブを設定した場合、ひとつずつ解析されてゆ
き、終わると自動的に次の解析が始まります。
シーケンスデータやターゲット領域のサイズ、PCのスペックにより、解析に要する時間は
変わります。
例) PCのスペック
OS: Windows 7 Professional
Processor: Intel® Xeon® CPU E5-2609 [email protected] GHz
RAM: 64 GB
データ
Human All Exon V5
ペアエンドあわせて約4 GbのFASTQファイル
所要時間
3.5 - 4 時間程度
44
解析が始まるとSample Review画面のStatusがRunningになります。
解析が終了するとStatusが Analyzed に変わり、Triage Viewでデータを確認できるように
なります。
45
6. Job Summaryを確認します。
a. Sample Nameの左のチェックボックスにチェックを入れた状態で、画面右下のJob
Summaryをクリックすると、Job Summaryウィンドウが開きます。Running状態のサン
プルでもJob Summaryを開くことが可能で、現在どのステップまで終わったかを確認
できます。
Job Summaryでは、使用したMethod名や、そ
の具体的な解析条件が確認できます。
またJob Statusの項目で、各ステップの終了時
間や、全体でかかった時間などを確認できま
す。テキストファイルとして保存することも可能
です。
46
Triage Viewによるデータの確認(Single, Pair, Trio解析)
1. Triage Viewを開きます。
SureCallのSample Review画面を開き、Statusを確認します。
Statusが Analyzed になっているサンプルはTriage Viewで解析結果を確認できます。
次のいずれかの方法でTriage Viewを開くことができます。
 Sample Nameをダブルクリックする
 Sample Name左のチェックボックスにチェックをいれ、画面右下のTriage View を
クリックする
*Triage Viewで一度に開けるサンプルは1サンプルです。
47
2. Check Out
Check out: Triage Viewでは、SureCallのアルゴリズムにより同定された変異を確認やコメ
ントの追加、公的データベースの情報の確認などができます。
データの確認・変更を行うためには、Change Status をクリックし、Check out を選択しま
す。確認・変更が終了したら、Check inを選択して保存します。
Check out
Check in
Sign out
:データを確認し、変更を行うためのステータス
:Check outステータスで加えた変更を保存しているステータス
変更を加えるためには、Check outに変更する必要があります。
:データの確認・変更が完了したステータス
Sign out後にさらに変更する場合はunlockする必要があります。
48
3-1、 Triage View (Single Analysis)
a. 画面構成
Mutation Table: SureCallが検出した変異のリスト。
クリックすると該当箇所が下部のブラウザに表示さ
れます。
ゲノムブラウザ:各変異の詳細を表示
Known Variantsを指定した場合、Known Variantタブが現れます。
また、Known Variantsに含まれるVariantはハイライトされます。
49
b. Mutation Tableの構成
Suppressに
カテゴリー分類
チェックを入れ
ると、Mutation を変更できます。
Reportから除外
されます。
Note欄にコメン
トを追加するこ
とができます。
複数のトランスク
リプトがある場合、
選択可能です。
*次ページもご参
照ください
遺伝子名を右クリックすると
OMIM, GeneCardの該当ページ
にリンクします。同様に、下記
カラムからも外部データベース
にリンクしています。
ID : NCBI
Position: dbVAR
Transcript: NCBI
Transcript ID: Ensemble
Uniprot Accession: Uniprot
検索窓に遺伝子
名などを入力する
ことで、検索可能
です。
各カラムのヘッダーをクリックす
ると、並べ替えができます。また、
フィルターアイコンを使って、フィ
ルターをかけることもできます。
フィルター条件はソフトウェアを
閉じた後も保存され、次に開い
た際にも適用されます。
Mutation Tableの各
項目については、巻
末をご参照ください。
変更内容はAudit Trailに記録さ
れます。Audit TrailはSample
Infoから確認することができま
す。
50
c. Transcriptの選択について
同定されたVariantの箇所に複数のトランスクリプトがある場合や、Variantが隣接
遺伝子の発現調節等に関与する場合など、1つのVariantに対してHGVS(Coding)が
複数該当する場合があります。
そのようなレコードでは、HGVS(Coding)カラムをクリックすると複数のTranscriptが表
示され、任意で選択することができます。Defaultではvariantによる影響が大きいと
判断されたTranscriptが選択されています。
注意
SureCallでは、Defaultで選択しているトランスクリプトについての情報に基づいて、
Categoryを決めています。また、HGVS(Protein), Primary Effect, Function Class, Codon,
AA, Coding, Transcript, Exon ID の各カラムの内容は、どのTranscriptを選択するか
によって異なります。
選択されているTranscriptが、注目したいTranscriptとは異なる場合もありますので、
その場合はHGVS(Coding)から該当するTranscriptを選択してください。
d. Genome Browserの構成
前の変異、次の
変異の箇所まで
ジャンプします。
ブラウザ下部をスクロールダウンすること
で、リードを確認できます。
ズームイン・ズーム
アウトします。
51
e. Genome Browser IGV情報のXIで同じ分子由来のリード数を確認する
(HaloPlex HS データの場合)
各リードの塩基上にカーソルを置くと、表示されます。
例: XI = 8 で、
同じmolecular barcode を持つ
Read が8リードあり、Remove duplicate
で除去され
1consensus read にまとめられたことを表
します
f. Known Variantsタブ
解析を行う際に、Known Variantsを指定した場合のみ、Known Variantsタブが現れます。
Known Variantsタブには、指定したKnown Variantsファイルに含まれるすべてのVariant
が含まれます。
Observation Detailsカラムに、この解析での結果が表示されます。
同じvariantが検出されればPresent,
検出されない場合は、Inspected Statusが表示されます。詳しくはヘルプをご参照ください。
52
3-2、 Triage View (Paired Analysis, Copy Number Method)
a. 画面構成
CNV Results: SureCallが検出したCNVのリスト。
クリックすると該当箇所が下部のブラウザに表示さ
れます。
ゲノムブラウザ
b. CNV Results Tableの構成
CNVの位置
Aberration
GAIN, DELETION
のいずれかが
表示されます。
Log Ratio
Gain, Deletionの
Log2 ratio
53
c. Genome browserの構成
CNV Results タブを表示している場合、Sample側のBAMファイルが表示されます。
前のCNV、次の
CNVの箇所まで
ジャンプします。
ズームイン・ズーム
アウトします。
GAINは赤色、
DELETIONは青色の
表示になります。
スコアが高いほど
色が濃くなります。
Genome browserの表示方式の変更
右クリックすると設定が表示されます。
たとえば、コンパクトに表示したい場合はCollapsedに変更します。
54
d. BAMファイルの追加
Sample、Reference両方のBAMファイルを並べて表示することができます。
Importから
Import BAMを選択、追加し
たいファイルを選びます。
GAINとコールされた箇所の表示例
SampleのBAM
ReferenceのBAM
(Import BAMで
追加表示)
55
3-3、 Triage View (Paired Analysis, Tumor Normal Method)
a. 画面構成
Result タブ: Tumor Normal MethodでSampleとReferenceを比較した結果
Sampleタブ: SampleのVariant call結果
Referenceタブ: ReferenceのVariant call結果
Observation: Tumor Normal methodで解析した結果、
GERMLINE, SOMATIC, AMBIGUOUS
Sample Typeカラムの+マークをクリックすると展開し、Sample,
Reference両方のGenotypeが表示されます。
56
3-4、 Triage View (Trio analysis)
a. 画面構成
Result タブ: Trio analysis methodでChildとMother, Fatherを比較した結果
Childタブ: ChildのVariant call結果
Motherタブ: MotherのVariant call結果
Fatherタブ: FatherのVariant call結果
Observation: Trio analysis methodで解析した結果
Sample Typeカラムの+マークをクリックすると展開し、Child,
Father, Mother のGenotypeが表示されます。
Trio解析:カバレッジに関する注意点
Child、Mother, Fatherともデフォルトでは40リード以上のカバレッジがある領域が解析対象に
なっています。3サンプルの間でカバレッジが異なる場合、結果に影響する可能性があります。
例えば、Childのみ40リードをこえていてvariantがコールされたものの、Mother, Fatherではリー
ド数が40に達しないために同じvariantがあってもコールされない、という状況になり、結果とし
ては「De Novo」とコールされてしまう、という場合もありますのでご注意ください。
57
レポート機能
5-1. レポートの作成とSign off
a. レポートの作成
SureCallでは、Variant Report、QC Report, Known Variant Report (Known variant
を指定した場合のみ)の3種類のレポートと、カスタムNGSレポートを作成するこ
とができます。
Variant Report: Mutation TableのサマリーがPDF形式で出力されます。
Known Variant Report: Known Variantを指定した場合、見つかったvariant と、
見つからなかったvariant(見つからなかった理由も記載)に分けて記載された
PDF形式のファイルが出力されます。
QC Report: シーケンス結果のサマリーがPDF形式で出力されます。Triage View
での変更には影響されません。
QC Reportは各Jobフォルダにも作成されています。
ReportからQC Reportを選ぶと
“Do you want to include exon table in QC Report?”
というダイアログが表示されます。Yesにすると、各エクソンごとのカバレッジが
レポートに含まれますが、ファイルサイズは大きくなります。Noを選ぶと、シーケ
ンスのQCデータのみの確認ができます。Exomeの場合のファイルサイズ例
Yes: 20 Mb, No: 200 kb
b. 結果の確認・変更が終了したら、Change Statusをクリックし、Sign off を選びま
す。Check in/Check outはすべてのユーザーが行えますが、Sign off するために
はAdministratorあるいはScientist権限が必要です。
Sign offすると、自動的にMutation Reportが作成されます。
いったんSign off したデータに再度変更が必要になった場合には、Change
Statusをクリックし、Unlock を選びます。
58
5-2. Custom NGS Report の作成と出力
Custom NGS Report とは、サンプル情報の記入項目やVariant table の項目などを設定したテンプ
レートを自ら作成し、そのテンプレートに則って出力するレポートのことです。
※ OneSeq Analysis の結果をCustom NGS Report で出力することはできません。
(1). Custom NGS Report template の作成
Configure Settings タブ > Custom NGS template 画面
で、Custom NGS Report のテンプレートの作成を行います。
Default Custom NGS Template が用意されており、このテンプレートを編集することで必要に応じたレ
ポートテンプレートを作成できます。
また、あらかじめ作成したテンプレート(.docファイル)のインポートを行うこともできます。
(※ .docxファイルはインポートできません)
59
a. テンプレートの編集
テンプレート内のテキストは自由に編集することができます。
また、画面右のInsertion tools ボタンで任意の場所にVariant Table やVariant Description、記入欄
を挿入することができます。
Insertion tools ボタン
Description :
Insertion tools ボタンの上にカーソルを乗せると、
各項目の説明が表示されます。
Header :
Header ボタンをクリックすると開くダイアログボックスでレポートのヘッダーとして記載する
項目を設定します。
60
Variant Table :
カーソルがある場所にVariant Table を挿入します。
Variant Table ボタンをクリックすると表示されるダイアログボックスでVariant Table に含める項目を選
択します。
左のAll Columns ボックス内の項目(Triage view のmutation table に表示される項目)からVariant
Table に含める項目を選びます。
Report に含める項目は6つまで選択することができます。
Variant Table にはTriage view のResult タブの内容が反映されます。
Variant Description :
カーソルがある場所にVariant Description(各variant のimpact を記述した項目) を挿入します。
記載する内容を編集することはできません。
61
Column Attribute / Free Comment :
レポート出力時に入力する記入欄を作成します。
日付、名前など文字数の少ない項目の記入欄
Custom Attribute :
Free Comment :
文字数の多い項目の記入欄
Footer :
Footer ボタンをクリックすると開くダイアログボックスでレポートのフッターとして記載する項目
を設定します。
b. 自分で作成したテンプレートのインポート
1.
Import をクリックします。
2.
インポートするテンプレートに名前を付け、Browse よりインポートするファイルを選
択します。
62
3.
インポートするファイルを選択したのち、Import をクリックします。
正常にインポートされると下図のようなメッセージが表示されます。
4.
Save をクリックします。
作成したテンプレートが左のReport template カラムに追加されます。
63
(2) Preview の確認・テンプレートの保存
左上のPreview ボタンをクリックすると、PDFで出力したときのレイアウトを確認することが
できます。
編集が終わったら左上の「Save as」をクリックし、名前を入力します。
作成したテンプレートが左のReport template カラムに追加されます。
(3) Custom NGS Report の出力
1. Triage view の右上にあるReport ボタン > Custom NGS Report をクリックすると、作成した
テンプレートの名前が表示されます。
使用するテンプレートを選択します。
64
2.
サンプル情報などを入力する画面が表示されます。
必要な情報を記入して下さい。
記入が完了したらGenerate Report をクリックし、保存先を選択して保存します。
3.
レポートを今すぐ開くかどうかを確認する画面が表示されますので、Yes/ No を選択して下さい。
65
OneSeq解析のワークフロー
サンプル解析の準備
Supporting Files
の画面
SureDesignからDesign fileをインポート
Referenceサンプルデータを解析
ReferenceサンプルのQC結果を確認
QC結果が良好であれば、Reference
サンプルデータをAcceptして、データ解析
に用いる
サンプル解析のラン
Analysis Workflow
の画面
OneSeq CNV and Mutation Analysisの
ワークフローを選択し、サンプルデータの
ランの設定を行ってランを開始
結果の表示
Triage View
の画面
SNPとCNVの解析結果の確認と
必要に応じてアノテーションの編集
結果のファイナライズおよびCNV/LOH
レポートとMutationレポートの出力
66
OneSeq解析の具体的な操作方法は、SureCallのHome画面のWatch Demo
Videos でも確認することができます。操作説明は英語となりますことをご了承く
ださい。
以下の操作説明では、SureCallによるOneSeqのデータ解析の基本的な操作方法
を説明します。各パラメータの詳細などについては、SureCallのHelp機能をご利
用ください。
67
サンプル解析の準備
デザインファイルのダウンロード
1. SureCallのHome画面からSureDesign Setting画面に移動します。
a. プログラムのウィンドウから、Supporting Files をクリックします。
b. 左のバーからDesignを選択すると、ダウンロード済みのデザインファイルが表示され
ます。新たにデザインファイルをダウンロードするには、Download New をクリックし
ます。
68
2. 必要なデザインファイルをダウンロードします。
a. Download New をクリックすると、SureDesignで作成済みのデザインと、アジレントの
カタログデザインのデザインファイル一覧が表示されます。
b. デザインファイルの数が多い場合には、赤枠の検索ボックスにデザインの名前やID
を入力することで、検索することができます。
c. ダウンロードするファイルにチェックを入れます。複数のデザインを選択して一度に
ダウンロードすることもできます。OneSeqのカタログ製品は、OneSeq Constitutional
Panelとなります。
d. すべて選択したら、Download をクリックします。
デザイン
名
デザイン
ID
69
3. バックグラウンドでダウンロードが開始されます。
a. 下記メッセージが表示され、デザインのダウンロードが開始されます。
b. OK をクリックしてダイアログボックスを閉じます。
c. Supporting Files 画面で、ダウンロードしたデザインが追加されています。
インポートが終了すると、Design Import Statusが”Import Successful”となり、解析に使用
できるようになります。
70
Referenceデータの解析
1. OneSeqのReferenceとしてシーケンスを行ったサンプルを、SureCallで解析し、QC結果を確認
して、Referenceとして使用するかどうかを決定します。サンプルのコピー数解析には、必ず
コピー数を比較するためのNormal DNAのReferenceサンプルデータが必要です。OneSeq用
のReference DNAとして、Agilent社から、OneSeq Reference DNA, MaleとFemale (Caucasian)
が販売されています。このReferenceサンプルをOneSeq Constitutinal Researchキャプチャラ
イブラリを用いてシーケンスする場合、イルミナ社HiSeq 2x100bpのReadで、約7 Gbのシーケ
ンス量が必要となります。
Agilent社のReferenceサンプルの既知のCNVはSureCallのtrackで確認することができます。
ご自分で準備されたReferenceサンプルのデータを使用する場合、必ず2本鎖で、CNVが最
小限(既知CNV)である健常人のDNAをご使用ください。
SureCallのSuppoting Fileメニューで、Reference Fileのタブを選択し、Add Newボタンをクリッ
クします。
2. 解析したReferenceサンプルのFASTQまたはBAMファイルを選択し、Selectをクリックします。
FASTQファイルを選択する場合は、Pair-endの2つのFastqファイルの両方を一度に選択する
ようにしてください。
71
選択したReferenceサンプルの情報を入力します。
Enter reference file name
この名前が、サンプルデータ解析の設定の際に、Referenceの選択画面に表示されますので、
適切なReferenceを選択するためにわかりやすい名前を付けます。
他のReferenceと同じ名前を付けてしまわないように注意してください。
Analysis Method
Default OneSeq Backbone CN
CNV解析にBackboneのプローブのみを使用します。このMethodがDefaultとなっています。
アジレントでの製品評価試験も、このMethodを用いて行われました。
Default OneSeq Full Design CN
CNV解析に、デザインに含まれるすべてのプローブを使用します。Backboneプローブ
以外の、SNVやInDel変異解析のためのターゲット領域のプローブもコピー数解析に
用いたいときに使用します。このMethodを使用すると、ノイズが若干増える可能性があり
ます。
Gender
既知の場合、MaleもしくはFemale、未知の場合 Unknownを選択します。
Analyze ボタンをクリックして、Referenceサンプルの解析をスタートさせます。
解析時間は、ご使用のPCの性能に依存しますが、CPU 8 Core、メモリ 24 Gbのワークステー
ション (HP Z800) で、1時間20分前後かかります。
72
Referenceサンプルの解析の進行状況は、下記のJob Summaryのタブで確認できます。
Referenceサンプルの解析の状況は、Reference File PropertiesのReference Import Statusの
Refreshボタンをクリックすることでも確認できます。解析が完了すると、StatusがComplete に
変わります。
73
ReferenceサンプルのQC Metircsを確認します。
ReferenceサンプルのQC Metricsのガイドラインとして
Median read depth in analyzable target regions の値が100以上であることを推奨しています。
その他のQC Metricsも期待値と乖離がないかどうか確認ください。
ReferenceサンプルのQC Metircsの結果に問題がないようでしたら、Reference File Propatiesの
画面で、このRefeernceをAcceptして Confirmボタンをクリックします。
この操作によって、Referenceが、サンプルのコピー数解析で使用できる状態になります。
74
サンプル解析のラン
サンプルデータのImport
1. SureCallのHome画面からAnalysis Workflow画面に移動します。
a. プログラムのウィンドウから、Analysis Workflow をクリックします。
b. OneSeq CNV and Mutation Analysis を選択して、Nextボタンをクリックします。
2. Importするシーケンスデータの種類を選択します。
・ アライメント前のFastqファイル → Import Unaligned Files
・アライメント後のBamファイル → Import Aligned Files
どちらかを選択
以下はFastqファイルのImportの例で説明します。
75
3. Importするシーケンスデータのファイルを選択します。
ペアエンドシーケンスの場合、Read1とRead2のファイルを同じフォルダに入れて同時に選択
します。
Addボタンをクリックし、目的のファイルがSampleのSet1に入ったことを確認します。
4. Analysis Methodを選択します。
Defaultでは、Default OneSeq Backbone CNか、Default OneSeq Full Design CNのどちらかが
選択可能です。
必ずReferenceサンプルを解析したMethodと同一のMethodを選択するようにしてください。
5. Referenceを選択します。
Reference選択画面をクリックすると、サンプル解析の準備のステップであらかじめ解析
してAcceptしたReferenceの一覧が表示されます。
適切なReferenceを選択し、OKボタンをクリックします。
76
6. Import samples and set up analysisの画面で、入力に間違いがないか確認します。
この画面でも、Backボタンを利用しても修正が可能です。
確認して問題がなければ、Nextボタンをクリックします。
7. Describe samplesの画面で、Sample Name を入力します。アルファベットとアンダーバー以
外の記号やスペースは入力できませんのでご注意ください。Genderが既知の場合は選択し
ます。未知の場合はUnknownを選択します。入力が終了したらNextをクリックします。
77
8. Run summary画面でサンプル名とAnalysis Methodを確認し、Run Analysisをクリックして、
ランを開始します。解析するデータのサイズとPCの性能によって大きく異なりますが
7 Gbのシーケンス量のデータを解析する場合、1検体あたり約 4-5 時間かかります。
9. 解析中のサンプルのStatus表示はRunningとなります。あるサンプルを解析中に、他のサン
プルを解析する設定を追加して、Runをスタートしておくことができます。
この場合、追加したサンプル解析のStatusはWaitingになり、入力した順番に順次解析が
行われます。解析が終了すると、StatusはAnalyzedに変わります。
また、解析の状況を確認したいサンプルを選択して、Job Summaryボタンを選択することで
解析の進行状況の詳細を見ることができます。
78
結果の表示
1. SureCallのSample reviewタブをクリックし、Sample Reviewの画面に移動します。
2. SampleデータのQC結果を確認します。
画面右上のReportsメニューをクリックして、QC Reportを選択します。
QC ReportにExon Tableを含めるかどうかを決めます。QC Reportの結果のみをチェックした
い場合はNoを選択します。
QC Reportを保存するフォルダを選択し、ファイル名を確認してSaveします。
Saveされた後、QC ReportをOpenして結果を確認します。
79
OneSeqのQC Reportでは、Reference結果とSample結果が並べて表示されます。
期待したカバレッジが得られているかなど確認します。
80
OneSeqのQC Reportの出力項目は、通常のSingle Analysisで得られるQC Reportとほぼ同じ
ですが、下記の3項目はOneSeqに独自のQC metricsとなります。
3. 画面左上のSNPとCNVタブをクリックし、画面表示の切り替えを行うことができます。
下記はSNV表示画面です。基本的にSingle AnalysisなどのSNP解析画面と同じ構成ですが
OneSeq Design Typeのカラムが追加されており、OneSeqのデザインのどの領域でSNV, InDel
が検出されたかを示しています。
Targeted design : CNV Backboneに追加されたターゲット領域で変異が検出されたことを
示します。OneSeq Constitutional Researchデザインの場合、Agilent
Focused Exomeのターゲット領域 16 Mbとなります。
Backbone design : CNV Backbone領域で変異が検出されたことを示します。
Overlap
: CNV Backboneとターゲット領域がオーバーラップしている領域で
変異が検出されたことを示します。
カラムのFilter機能を使用して、ターゲット領域の変異のみを抽出することなどが
可能です。
81
4. 下記は、CNVタブをクリックしたときの画面表示となります。
検出されたコピー数
変異の位置情報
変異の
種類
Log2Ratioの
平均値
変異の
サイズ
その領域にある
遺伝子名
サンプルとReferenceの比較による
コピー数変化のScatter Plot(Log2Ratio)
GAINの検出
Aberration Panel
LOSSの検出
B-allele frequency Plot
LOH Panel
Genes track
Design track
5. 以下はToolバーの機能です。
コマンドボタン
Bookmark
メニュー
現在画面表示している位置の情報
数値の入力で変更が可能
位置表示の
スクロール
位置表示の
拡大縮小ボタンと
バー
6 以下はコマンドボタンの機能です。
Aberrationの
表示/非表示
LOHの
表示/非表示
Scatter Plotの
表示/非表示
マウスによる
ズーム範囲設定
Grid lineの
表示/非表示
画面表示の Track表示の
設定
設定
82
7 画面の表示設定やTrackは必要に応じてカスタマイズできます。
画面表示の設定
各種Trackの設定
例えば、アジレント社から提供されているMaleもしくはFemaleのReference DNAを使用して
いる場合、Track表示の設定画面で、Agilent Male CNV Referenceもしくは、Agilent Female
CNV Referenceを選択することで、画面に既知のCNVを表示することができます。
下記に例を示します。
ReferenceのCNVのDeletionの
結果と考えられるGAINの検出
Agilent Female CNV Reference
の既知のCNV (Deletion)
83
8. CNV Tableの各CNVをクリックすることで、そのCNVがGenome Viewerに表示されます。下記
はNA20409のサンプルにおけるChr15の既知のLOHの検出例です。
既知のLOHの検出例
9. Genome Viewをクリックすると、ゲノム全体にわたるCNVの検出結果のサマリが画面に表示
されます。もう一度クリックすると元の画面に戻ります。初期設定では、GAINが青色バー
LOSSが赤色バー、LOHが水色バーで示されます。
84
10. CNV TableのTypeのFilter機能を用いると、GAINのみ、LOSSのみ、LOHのみなどを集めること
ができます。
11. ReportsメニューのCNV/LOH Reportをクリックすると、検出されたコピー数変化のReportを
作製することができます。こちらで作製したReportには、解析条件のヘッダーが含まれます。
CNVのTableのみの情報が得たい場合は、Exportメニューから、Export Tableを選択して
xlsファイルを得ることも可能です。
どちらの機能でReportを作製しても、Tableに何らかのFilterがかかっている場合は
Filterがかかった結果を出力しますので、ご注意ください。
Filterがまったくかかっていないデータを出力したいときには、下記の画面の
Clear Filterボタンをクリックして、Filter AppliedがNoneになっていることを事前に確認してか
らReportを出力します。
85
Reference
QC Reportの項目
SureSelect XTとQXTおよびHaloPlexで、若干異なるフォーマットのQC Reportが
出力されます。
ここでは初めに、SureSelect XTのQC Reportについて説明し、その後、QXTとHaloPlexのレポートで
異なる点を説明します。
SureSelect XT
SureSelect QXT
HaloPlex
86
用語の定義
Target Regions :
キャプチャの対象であるターゲット領域
Amplicons:
HaloPlexにおいて、ターゲット領域をカバーするために選択され、実際に増幅される
アンプリコン
Sequenceable Regions:
HaloPlexにおいて、Ampliconの位置情報とリード長から計算された、実際に
シーケンスされる領域
Covered Regions:
SureSelectにおいては、ターゲット領域をキャプチャするためのプローブでカバーさ
れた領域
HaloPlexにおいては、Sequenceable Regionの両端を5 bpずつ削った領域。両端 5 bp
は制限酵素認識サイトであるため、バイアスがかかる可能性があり、解析可能領域か
らは除外しています。
Missed Regions:
SureSelectにおいては、プローブがデザインされなかった領域
HaloPlexにおいては、Ampliconでカバーすることができず、解析できない領域
Analyzable Target Bases:
Target RegionのうちCoveredとオーバーラップしている領域
87
SureSelect XT QC Report
SAMPLE ATTRIBUTE
Sample Name: データ解析時に入力したサンプル名が表示されます
Date: データ解析を行った日付が表示されます
QC METRICS
Metrics For Input File:
Number of duplicate reads :
MappingされたReads中で、chromosomeとStart, Stopが同一のReadの数、Pair
およびUnpairの両方を含む
Molecular Barcode情報が反映されたHaloPlex HS データの場合は、上記に加え
同じMolecular Barcodeを持つと判断されたReadの数
(%) 上記のDuplication Reads数 / MappingされたRead数(PairおよびUnpairの
両方を含む) x 100
Overall metrics for all reads in BAM file
Number of reads in bam file:
アライメントプロセスに使用されたTotalのRead数、アライメントされたReads
とされていないReadsの両方を含む
Number of reads in bam file passing mapping quality filters:
Read Quality filterをパスし、かつMapping qualityが0以上。ゲノム上にユニー
クあるいは複数個所にMappingされたRead数。Duplicate readは除外されている。
(%) 以後の計算では、この値がそれぞれのReadの%計算の分母として扱われるため、
ここでは100%となります。
Number of reads mapping to multiple genomic locations:
ゲノム上の複数個所にMappingされたRead数
Number of reads in covered regions:
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsに
1 bp以上OverlapしてMappingされたReadの数
Number of reads +/- 100bp covered region
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsの両端
に100bpずつPaddingした領域に1 bp以上OverlapしてMappingされたRead
の数
Number of reads +/- 200bp covered region
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsの両端
に200bpずつPaddingした領域に1 bp以上OverlapしてMappingされたRead
の数
88
Percentage of covered regions with zero coverage:
SureSelectデザインのCovered regionsのうち、全くReadでカバーされていない
(0 coverage)baseの割合
Median QV bases used in variant calling:
Quality FilterをパスしたReadのBase QualityのMedian値
Average Read Length:
(Total high quality mapped bases) / (Number of reads in bam file passing read
quality filters)
Total high quality mapped bases:
Quality FilterをパスしたReadの総塩基数 (bases)
Overall metrics related to analyzable target regions
Number of genomic bases in analyzable target region:
SureSelectデザインがカバーしている領域の総塩基数 (bases)
Number of sequenced bases in analyzable target regions:
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsに
Mappingされた総塩基数 (bases)
Number of reads:
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsに
OverlapしてMappingされたReadの数
Average read depth in analyzable target regions:
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsに
OverlapしてMappingされたReadの読み取り深度(Read Depth)の平均値
Median read depth in analyzable target regions
ReadのQuality Filterをパスし、SureSelectデザインのCovered regionsに
OverlapしてMappingされたReadの読み取り深度(Read Depth)の中央値
Percentage of analyzable target bases with:
at least X read:SureSelectデザインのCovered regionsの総塩基のうち、少なくとも
X のRead数でカバーされた塩基の割合
Percentage of analyzable target regions covered by:
at least X read:SureSelectデザインのCovered regionsのうち、少なくとも X の
Read数でカバーされた領域の割合。ReadsはCovered regionsと1 bp以上のOverlap
でカバーされたとみなされている
89
QC CHARTS
Analyzable Target-Coverage plot:
SureSelectデザインのTarget RegionsとCovered regionsがオーバーラップしてい
るAnalyzable Target領域 について、Base単位での読み取り深度(read depth)の
積算プロット
Covered Region-Coverage plot:
SureSelectデザインのCovered regions について、読み取り深度(read depth)の
積算プロット
Analyzable Target-Oversequencing coverage plot:
Over-Sequencing Factorに対するAnalyzable Target basesの%を示すグラフ。
Over-Sequencing Factor:The over-sequencing factor represents the incremental
amount of sequencing that is required to cover additional analyzable target bases
at the average read depth.
Analyzable Target-Coverage uniformity plot:
Read Depthを正規化した数値に対応するanalyzable target basesの割合
SureSelect QXTおよびHaloPlexのQC Reportに追加されて出力される項目
QC METRICS
Metrics For Input File:
Number of reads in untrimmed fastq file:
シーケンサからのRaw Sequencing Read数
ペアエンドシーケンスの場合は、Forward Readとそのペアの両方をカウントします。
Number of reads in fastq file after trimming:
アダプタトリミングとQualityトリミング後のtotal read数
Number of trimmed reads:トリミング処理されたRead数
Number of untrimmed reads:トリミングの処理をうけなかったRead数
Number of reads discarded:
トリミングの結果、the minimum length threshold以下のRead長となって除去され
たRead数
90
Mutation Tableの 項 目
Column name
Description
AA
The amino acid change created by the mutation. For
Calclated by SureCall
example, "K410N" would indicate that the mutation changes
a lysine to an asparagine at amino acid position 410.
The frequency of the strongest mutant allele.
SAMtools or SNPET
1000G allele frequency.
1000 Genomes
(bunded with
anotations)
The frequency of the mutant allele according to NCBI
NCBI
Allele Frequency
Allele Frequency
(1000G)
Allele Frequency
NCBI
Allele Origin
Alt Allele
Category
Allele origin of the mutation (somatic or germline).
The alternate base or bases that were identified at uation
site; for indels it is the indel sequence.
Categoy of the mutation
Source
NCBI
Calclated by SureCall
Determined by
SureCall according to
the categorization used
in the analysis. Users
can change the
category from Triage
View.
Chrom
Chromosome of the mutation; only supports chromosome 1- UCSC genome build
22, X, Y and M
hg19
Clinical (dbSNP)
Clinical significance of the mutation in dbSNP; options are:
NCBI
Pathogenic
Probably pathogenic
Not pathogenic
Suspect
Unknown
Clinical (NCBI)
Shows whether this variant has clinical information in NCBI
and what it is annotated there.
Coding
Lists "CODING" if the mutation is in the coding region of a
Calculated by SureCall
Codon
The codon change created by the mutation. The column lists Calculated by SureCall
the reference codon sequence followed by the mutated
codon sequence, with the mutated bases in capital letters.
For example, "gcC/gcT" would indicate a C > T mutation.
Conservation Score The GERP++ RS score.
GERP++ (bundled with
A larger the score indicates a more conserved site.
annotations)
See
COSMIC ID
The identifier by which the variant can be searched in
COSMIC.
CosmicAASyntax
The amino acid change created by the mutation.
COSMIC cancer
database
CosmicFrequency
Frequency of the mutation in the associated cancer type.
COSMIC cancer
database
CosmicMutationDesc The effect of the mutation on gene translation.
COSMIC cancer
ription
This column provides an expanded explanation of the
database
primary effect provided in the Primary Effect column.
91
Column name
Description
Source
CosmicTumorSite
Site or tissue type of the cancer associated with the
mutation.
The effect of the mutation on gene translation.
This column provides an expanded explanation of the
primary effect provided in the Primary Effect column
The Ensemble Exon ID for the exon affected by the mutation.
COSMIC cancer
database
Calculated by SureCall
Effect
Exon ID
Forward Alt Alleles
Forward Alt Bases
Forward Ref Alleles
Forward Ref Bases
Function Class
FunctionalClass
Gene
Ensemble
The number of reads in the 5’ to 3’ direction that have an
SAMtools or SNPPET
alternative base at the mutation site.
See Reference and Alternative Alleles below for more
detailed information.
The number of forward reads with the alternative base at
that locus.
See Reference and Alternative Bases below for more
detailed information.
The number of reads in the 5’ to 3’ direction that have the
base of the reference sequence at the mutation site.
See Reference and Alternative Alleles below for more
detailed information.
The number of forward reads with the reference base at that
locus
See Reference and Alternative Bases below for more
detailed information.
Functional class is the class of the variant (missense ,
Calculated by SureCall
nonsense, silent ) as determined by SureCall by looking at
the primary effect.
Primary effect is determined by effect of the chosen
transcript wherever multiple transcripts are available and the
highest impact effect otherwise.
The functional class annotation (sense, missense, nonsense) NCBI
and design annotation from NCBI.
Name of the gene that overlaps the mutation. In determining RefSeq (bundled with
which gene to report in the Gene column, SureCall considers annotations)
the location and effect (see Effect column) of the mutation.
Genotype likelyhood (Trio analyses only) The log odds that the call is due to a true Calculated by SureCall
mutation in the sample versus the log odds that the call is
due to a sequencing error. The three values in the column
correspond to the three samples used in Trio analysis (child,
father, mother).
The genotype likelihood values are calculated under a
diploid model assumption.
92
Column name
Description
Source
Genotype quality
(Trio analyses only) The phred quality score of the likelihood
of calling a genotype given a diploid model assumption. In a
diploid model, the possible genotypes considered are: 1)
homozygous for the reference allele (Ref-Ref); 2)
homozygous for the alternate allele (Alt-Alt); and 3)
heterozygous (Ref-Alt).
The highest possible score is 100, which indicates high
confidence in the call. You may see almost all the mutations
have a value of 100.
The disease or other annotation for the variant in the GWAS
catalog.
The HGVS nomenclature description of the mutation in the
coding DNA sequence.
The HGVS nomenclature description of the mutation in the
genomic sequence.
The HGVS nomenclature description of the mutation in the
protein sequence.
Zygosity of the mutation (homozygous or heterozygous).
Mutation ID (for annotated mutations).
SureCall looks for an ID in the annotation databases in the
order shown below:
1
rsId
2
cosmic
3
GWAS catalog
4
TCGA
5
blank if nothing found
Interpro Domain ID for the domain or conserved site in which
the mutation is located; the number in brackets is the count
of times; see http://www.ebi.ac.uk/interpro/.
Lists "Called Known Variant" if the mutation is included on
the known variants file associated with the sample. This
column only appears if a known variants file was associated
with the sample during setup of the analysis workflow.
Calculated by SureCall
Global minor allele frequency.
Root-mean-square mapping quality of the reads covering the
mutation.
User-added notes pertaining to the mutation
This is only relevant for multisample analyses with SNPPET.
In case of Pair analysis, it denotes whether variant is somatic,
germline, or ambiguous.
For Trio, it denotes whether the variant is de novo, only
homozygous or heterozygous in mother, only homozygous or
hetrozygous in father, or found in both parents or ambiguous
(not sufficient evidence to determine).
NCBI
Calculated by SureCall
aligner
User
GWAS
HGVS(Coding)
HGVS(Genomic)
HGVS(Protein)
HOM/HET
ID
Interpro
Is Known Variant
MAF dbSNP
Mapping Quality
Notes
Observation
NCBI
NCBI
NCBI
NCBI/hapmap
Interpro domain
database (bundled
with annotations)
93
Column name
Description
OMIM ID
ID by which the user can look up the variant in OMIM. It is
the same ID that is used in the link show in OMIM from gene
column.
PolyPhen score for missense mutations:
PolyPhen2 prediction
D=probably damaging
based on HumVar
P=possibly damaging
B=benign
Start position of the mutation.
UCSC genome build
hg19
The primary effect of the mutation on gene translation.
Calculated by SureCall
Lists "TRUE" if PubMed has a citation for the mutation based NCBI
on its dbSNP ID. Lists "FALSE" if PubMed does not have a
citation for the mutation based on its dbSNP ID.
P-value for the mutation; this is the same p-value used to
Calculated by SureCall
calculate the Quality score.
The Phred quality score of the mutation; converted from the Calculated by SureCall
Chi square test based p-value.
Raw read depth at mutation site based on reads that are not Calculated by SureCall
filtered out by quality considerations (Mapping Quality,
Casava filter for Illumina, TMAP output filter etc).
For more information, see http://samtools.sourceforge.net/.
PolyPhen2 Score
Pos
Primary Effect
PubMed
P-Value
Quality
Read Depth(Raw)
Ref Allele
Reference sequence at mutation site.
Reverse Alt Alleles
The number of reads in the 3’ to 5’ direction that have an
alternative base at the mutation site.
See Reference and Alternative Alleles below for more
detailed information.
The number of reverse reads with the alternative base at
that locus.
See Reference and Alternative Bases below for more
detailed information.
The number of reads in the 3’ to 5’ direction that have the
base of the reference sequence at the mutation site.
See Reference and Alternative Alleles below for more
detailed information.
The number of reverse reads with the reference base at that
locus.
See Reference and Alternative Bases below for more
detailed information.
SIFT score of the mutation; provided for missense mutations
only.
If the score is less than or equal to 0.05, then the amino acid
substitution is damaging (D); scores above 0.05 are
considered tolerated (T).
Reverse Alt Bases
Reverse Ref Alleles
Reverse Ref Bases
SIFT Score
Suppress
Source
UCSC genome build
hg19
SAMtools or SNPPET
SAMtools or SNPPET
SAMtools or SNPPET
SAMtools or SNPPET
SIFT
Check box for suppressing the mutation.
94
Column name
Description
Source
Transcript
NCBI Transcript ID for the transcript overlapping the
mutation.
Ensemble Transcript ID for the transcript overlapping the
mutation.
Indicates SNP, Indel, or MNP.
Uniprot accession number for the gene overlapping the
mutation; see http://www.uniprot.org/.
NCBI
Transcript ID
Type
Uniprot Accession
Ensemble
Uniprot
95
Copyright Agilent Technologies 2015
すべての権利は留保されています。著作権法で認められている場合を除き、本書を許可なく
複製、改作、翻訳することは禁止されています。
本和文プロトコルの版権は全てAgilent Technologies, Inc.が所有しています。
ご注意
本書に記載した内容は、予告なしに変更することがあります。
本書は、内容について細心の注意をもって作成いたしましたが、万一ご不審な点や誤り、記載
もれ等、お気づきの点がございましたら当社までお知らせください。
当社では、下記の項目を補償の対象から除外いたします。
ユーザの誤った操作に起因する機器などの損傷、性能上のトラブル、損害
本キットの本来の用途以外の使用に起因する機器などの損傷、性能上のトラブル、損害
本プロトコルに以外の方法または試薬を用いたことによる性能上のトラブル、損害。
分析結果に基づく損失
本書の内容の一部または全部を無断で複写、転載したり、他の言語に翻訳することは法律で
禁止されています。複写、転載などの必要が生じた場合は、当社にお問い合わせください。
本製品パッケージとして提供した本マニュアル、CD-ROM等の媒体は本製品用にだけお使い
ください。
保証
本書に記載した内容は、予告なしに変更することがあります。
Agilent Technologiesは、本品に関していかなる保証も行いません。これには暗黙の保証、ま
たは商品性および特定目的への適合性が含まれますが、それらに限定されません。
Agilent Technologiesは、本書に含まれている誤植、あるいは本品の性能、または使用に関
する偶発的ないし間接的な損害に関して責任を負いません。
発行者
アジレント・テクノロジー株式会社
ゲノミクス部門
SureCallに関するサポートお問い合わせ窓口
Tel: 0120-477-111
E-mail: [email protected]
*SureCallに関するテクニカルな質問と明示ください。
96
Was this manual useful for you? yes no
Thank you for your participation!

* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project

Download PDF

advertisement