NBDC Research ID: hum0056.v1

 

研究内容の概要

目的: いわて東北メディカル・メガバンク機構(IMM)が実施した多層オミックス参照パネルを研究コミュニティに提供すること。

方法: 東北メディカル・メガバンク計画地域住民コホート参加者197名のバフィーコートもしくは末梢血より単離した単球、CD4陽性Tリンパ球、好中球を対象に、次世代シークエンサーによる全ゲノムシークエンス(Whole Genome Sequencing: WGS)、全ゲノムバイサルファイトシークエンス(Whole Genome Bisulfite Sequencing: WGBS)およびRNA シークエンス(RNA Sequencing: RNA-seq)を実施した。197名のSNPsのアリル頻度情報、CpG部位のメチル化率情報、各転写物のFPKM値情報を提供する。

対象: IMM地域住民コホート102名の単球、102名のCD4陽性Tリンパ球、94名の好中球(計:197名)

URL: http://imethyl.iwate-megabank.org/

 

データID内容制限公開日
hum0056.v1.freq.v1 (1)SNPsのアリル頻度情報(WGS) 非制限公開 2018/03/30
hum0056.v1.ch3.v1 (2)各CpG部位の平均メチル化率情報(WGBS) 非制限公開 2018/03/30
hum0056.v1.fpkm.v1 (3)各遺伝子の平均FPKM値(RNA-seq) 非制限公開 2018/03/30

※リリース情報はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0056.v1.freq.v1

対象 IMMの地域住民コホート:197名
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500/HiSeq X]
ライブラリソース 102名の単球、102名のCD4陽性Tリンパ球、94名の好中球より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA PCR-Free HT Sample Prep Kit
断片化の方法 超音波断片化(Covaris社、LE220)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 162 bp(好中球72検体のみ150 bp)
クオリティコントロール方法 qMiSeq*1
重複するリードの除去
リアライメントおよびベースクオリティのキャリブレーション
マッピング方法 Bowtie2(version 2.1.0)
リファレンス配列 GRCh37d5
平均カバー率(Depth) 40.9 ×
変異検出方法 Bcftools software(ver. 0.1.17-dev)
総リード数 / ユニークにマップされたリード数

230,956,735,490 / 228,318,012,630

(単球:58,859,522,366 / 57,737,359,722)

(CD4陽性Tリンパ球:58,964,563,094 / 57,845,976,317)

(好中球:113,132,650,030 / 112,734,676,591)

※マップされたリード数:複数マップの候補がある場合にはランダムに1か所にアライメントしている。

フィルタリング マイナーアリルカウント(minor allele count:MAC) > 1
SNP数(QC後)

単球:8,129,415 SNPs

CD4陽性Tリンパ球:8,137,443 SNPs

好中球:8,175,808 SNPs

NBDC Data Set ID

hum0056.v1.freq.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量

単球:403 MB(txt)

CD4陽性Tリンパ球:403.5 MB(txt)

好中球:409 MB(txt)

コメント(利用にあたっての制限事項) NBDC policy

*1Katsuoka et al, Analytical Biochemistry, 2014

 

hum0056.v1.ch3.v1

対象 IMMの地域住民コホート:197名
規模 WGBS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 102名の単球、102名のCD4陽性Tリンパ球、94名の好中球より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA Methylation Kit
断片化の方法 バイサルファイト反応
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 125 bp
クオリティコントロール方法 電気泳動とqPCR
重複するリードの除去 SAMtools(ver.0.1.19)
リアライメントおよびベースクオリティのキャリブレーション
マッピング方法 NovoAlign(ver.3.02.08)
リファレンス配列 GRCh37d5
平均カバー率(Depth)

単球:31.1 ± 1.6

CD4陽性Tリンパ球:31.0 ± 1.6

好中球:54.7 ± 1.6

メチル化コール・メチル化率算出方法 NovoMethyl(ver.3.02.08)
総リード数 / ユニークにマップされたリード数

単球:780,709,034 ± 45,934,514 / 624,432,868 ± 38,766,158

CD4陽性Tリンパ球:779,212,752 ± 40,833,955 / 667,934,331 ± 33,002,407

好中球:1,144,935,054 ± 33,512,764 / 994,992,101 ± 32,667,070

NBDC Data Set ID

hum0056.v1.ch3.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量

単球:1.4 GB(txt)

CD4陽性Tリンパ球:1.4 GB(txt)

好中球:1.5 GB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0056.v1.fpkm.v1

対象 IMMの地域住民コホート:197名
規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 102名の単球、102名のCD4陽性Tリンパ球、94名の好中球より抽出したRNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq RNA Library Preparation Kit v2
断片化の方法 高温条件下での2価陽イオンによる断片化
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 125 bp
クオリティコントロール方法 電気泳動とqPCR
重複するリードの除去
リアライメントおよびベースクオリティのキャリブレーション
マッピング方法 TopHat(ver. 2.0.13)
リファレンス配列 GRCh37、Human GENCODE Gene Set(release 19)
平均カバー率(Depth) -
遺伝子構造・新規の転写産物推定・発現量算出方法 cuffquantとcuffnorm
総リード数 / ユニークにマップされたリード数

単球:33,917,157 ± 3,153,528 / 27,390,039 ± 2,494,286

CD4陽性Tリンパ球:35,175,996 ± 1,275,575 / 27,506,624 ± 1,669,459

好中球:47,040,140 ± 6,289,540 / 43,241,139 ± 8,491,065

対象遺伝子数

単球:16,282 genes

CD4陽性Tリンパ球:18,299 genes

好中球:14,534 genes

NBDC Data Set ID

hum0056.v1.fpkm.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量

単球:818 KB(txt)

CD4陽性Tリンパ球:919 KB(txt)

好中球:731 KB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 清水 厚志

所 属 機 関: 岩手医科大学 災害復興事業本部

プロジェクト/研究グループ名: いわて東北メディカル・メガバンク機構(http://iwate-megabank.org/)/生体情報解析部門

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
文部科学省 次世代医療研究開発拠点形成事業費補助金 東北メディカルメガバンク計画
国立研究開発法人 日本医療研究開発機構 東北メディカルメガバンク計画

 

関連論文

タイトルDOIデータID
1 Genome-wide identification of inter-individually variable DNA methylation sites improves the efficacy of epigenetic association studies doi: 10.1038/s41525-017-0016-5