NBDC Research ID: hum0158.v3

 

研究内容の概要

目的: 日本人の肝臓がんにおけるゲノム変異を探索する

方法: 肝臓がん切除切片における腫瘍組織および非腫瘍組織または末梢血より抽出したDNAもしくはRNAを使用したNGSライブラリーを作成後、Illumina HiSeqまたは Genome Analyzerにて塩基配列を決定する。

対象: 肝臓がん(肝細胞がん、肝内胆管がん、混合型肝がん)患者の非腫瘍組織および腫瘍組織のDNA・RNA

 

データID内容制限公開日
JGAS000151

NGS(WGS)

NGS(RNA-seq)

制限公開(Type I) 2018/10/22
JGAS000151 にデータ追加 NGS(WGS) 制限公開(Type I) 2019/06/21
JGAS000151 にデータ追加 NGS(WGS)のbam/gvcfデータ 制限公開(Type I) 2021/07/13

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

NGS(WGS)

対象

肝臓がん:258 症例 + 5 症例

(肝細胞がん [ICD10:C220]、肝内胆管がん [ICD10:C221]、混合型肝がん [ICD10:C227])

  腫瘍組織:301 検体 + 5 検体

  非腫瘍組織:265 検体(末梢血:257 検体、肝臓:3 検体 + 末梢血:5 検体)

規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2000, Genome Analyzer IIx, NovaSeq 6000]
ライブラリソース 肝臓がん切除切片における腫瘍組織および非腫瘍組織または末梢血から抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA LT Sample Prep Kit、TruSeq Nano DNA Low Throughput Library Prep Kit、Paired-End DNA Sample Prep Kit、TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
クオリティコントロール方法

リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。

Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。

Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。

1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。

その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。

重複するリードの除去 Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション GATK 3.7
マッピング方法 BWA mem 0.7.12
マッピングクオリティ GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 GRCh37/hg19(hs37d5)
平均カバー率(Depth) HiSeq 2000:31.8x、Genome Analyzer IIx:30.0x、NovaSeq 6000:28.0x
変異検出方法 GATK 3.7 HaplotypeCaller
SNV数(QC後)

76,768,387(常染色体)

2,898,518(X 染色体)

INDEL数(QC後)

10,202,908(常染色体)

410,435(X 染色体)

Japanese Genotype-phenotype Archive Dataset ID

JGAD000228(fastq)

JGAD000404(220 症例の非腫瘍組織由来データを解析したbam/vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。

総データ量 48 TB(fastq) + 581 GB(fastq) + 25.2 TB(bam、vcf)
コメント(利用にあたっての制限事項) NBDC policy

 

NGS(RNA-seq)

対象

肝臓がん:238 症例

(肝細胞がん [ICD10:C220]、肝内胆管がん [ICD10:C221]、混合型肝がん [ICD10:C227])

  腫瘍組織:238 検体

  非腫瘍組織:201 検体

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2000, Genome Analyzer IIx]
ライブラリソース 肝臓がん切除切片における腫瘍組織および非腫瘍組織から抽出したRNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq RNA Sample Prep Kit v2 もしくは TruSeq Stranded mRNA Library Prep Kit
断片化の方法 熱処理
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
Japanese Genotype-phenotype Archive Dataset ID JGAD000229
総データ量 3 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 中川 英刀

所 属 機 関: 理化学研究所 生命医科学研究センター

プロジェクト/研究グループ名:-

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号

 

関連論文

タイトルDOIデータID
1 Whole-genome mutational landscape and characterization of noncoding and structural mutations in liver cancer. doi: 10.1038/ng.3547

JGAD000228

JGAD000229

2 Genomic and Transcriptomic Profiling of Combined Hepatocellular and Intrahepatic Cholangiocarcinoma Reveals Distinct Molecular Subtypes. doi: 10.1016/j.ccell.2019.04.007

JGAD000228

JGAD000229

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間
木下 健吾 東北大学 東北メディカル・メガバンク機構 日本人全ゲノムデータベースの構築 JGAD000228 2019/06/24-2022/03/31
寶珍 輝尚 京都工芸繊維大学・情報工学・人間科学系 機械学習によるヒトゲノム変異の解析 JGAD000228, JGAD000229 2019/07/09-2021/03/31
白石 航也 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 ゲノム解析に基づく宿主並びに腫瘍における免疫応答ネットワーク機構の解明 JGAD000228, JGAD000229 2019/08/05-2023/03/31
小笠原 理 国立遺伝学研究所 生命情報・DDBJセンター JGA/AGDゲノムデータを利用したヒトゲノム解析ワークフローの評価 JGAD000228, JGAD000229 2019/10/11-2024/03/31
Kichoon Lee Department of Animal Sciences, The Ohio State University Investigation on allele-specific gene expressions in humans JGAD000228, JGAD000229 2021/05/24-2021/12/31
Jinyan Huang Zhejiang University School of Medicine Comprehensive analysis of alternative splicing in malignant tumors JGAD000228, JGAD000404 2022/03/07-2024/01/01
浜田 道昭 早稲田大学 理工学術院 日本 RNA標的創薬データベースの構築 JGAD000229 2022/12/26-2025/03/31