次世代シーケンス解析(MiSeq) シーケンスデータのDDBJへの登録について

次世代シーケンサーを用いて得られたデータを論文として投稿する際は、DDBJ等の公的データベースへの登録が必要であることがほとんどです。ここではDDBJへの登録について説明させていただきます。

サンガー法シーケンスデータとの違い

次世代シーケンサーで得られる膨大なシーケンスデータの登録は、サンガー法のシーケンスデータの登録方法とかなり異なっています。サンガー法では一つの塩基配列に対して付帯する情報を登録するという形式ですが、次世代シーケンサーで一度に得られる塩基配列データは膨大であり、付帯する情報も階層化されています。
具体的には(1)BioProject(2)BioSample(3)Experimentの3層から構成されています。
  • (1)BioProject 実験の目的
  • (2)BioSample 解析したサンプルについての諸情報
  • (3)Experiment 各サンプルについて行なった実験についての諸情報
さらに、実際の登録にあたっては次世代シーケンサーのrunの条件も必要となってきます。
つまり、次世代シーケンサーで得られたデータ(fastqファイル等)を登録するには下記の4層から構成される情報の登録が必要です。
  • (1)BioProject
  • (2)BioSample
  • (3)Experiment
  • (4)RUN
(3)および(4)RUNについては、次世代シーケンサーでのrun条件やサンプル調製方法等の技術的内容が多く含まれるため、納品時に弊社からできる限りの情報をご提供させていただきます。
(1)および(2)については各実験固有の情報ですので、弊社から情報のご提供はできません。

より詳しいご説明は下記のスライドショーを参照願います。