アカデミックセッション/as2c

アカデミックセッション

新しいデータ科学とゲノムサイエンスの出会い
座長: 瀬々 潤 (東京工業大学 大学院情報理工学研究科 計算工学専攻・准教授)
二階堂 愛 (理化学研究所情報基盤センター バイオインフォマティクス研究開発ユニット・ユニットリーダー)
ID AS2c 日時 9/5(木) 10:50-12:20 会場 C
概要 NGSの登場で,ゲノムデータの量は爆発的に増加しました.このデータが新しい解析法と出会う事で,量は質へと変貌し,今まで夢物語だった研究が,実現可能となります.
本セッションでは,第一線でデータ解析手法を開発する方々をお呼びし,最新のデータ解析手法を提示して頂きます.提示頂く解析手法は,一見NGSに関係無さそうなものも含まれますが,NGSへの応用をディスカッションすることで,新たなNGS技術の潮流を,このセッションから作ります.
  • 「データの死蔵化を防ぐ切り札 -ライフサイエンス分野におけるプライバシ保護データマイニングの応用- 」
    清水 佳奈 (産業技術総合研究所生命情報工学研究センター RNA情報工学チーム・主任研究員)
  • 近年,ライフサイエンス分野では計測技術が著しく進歩し,大量のデータを取得することが可能となった.これらのデータを十分に活用することによって生物学・医学の分野で大きな発展が望める.しかし,個人ゲノムや臨床研究で得られる情報などは,プライバシ保護の観点から自由に流通させることが難しく,有用なデータの死蔵化につながっている.このため,データの中身を秘匿したまま情報解析を行うプライバシ保護データマイニングと呼ばれる技術に注目が集まっている.本講演では,ライフサイエンス分野におけるプライバシ保護データマイニングの技術動向を概説し,最近我々が開発した類似化合物の秘匿検索技術を紹介する.また,本研究分野における今後の課題についても幅広く議論したい.
  • 「オミックスデータから薬物標的分子を網羅的に予測するためのバイオインフォマティクス 」
    山西 芳裕 (九州大学生体防御医学研究所, 九州大学高等研究院・准教授)
  • 大半の薬物は標的とするタンパク質などの生体分子との相互作用を介して、薬効や副作用という形で人体に影響を及ぼす。そのため、薬物・標的タンパク質間の相互作用の同定は、医薬品の開発過程において最重要課題である。ポストゲノム研究では、ゲノム、トランスクリプトーム、プロテオームなどの遺伝子やタンパク質に関する大量のオミックスデータが得られるようになってきた。同時にハイスループットスクリーニングなどの技術の発展によって、膨大な数の化合物や薬物に関するケミカル情報や生理活性情報も蓄積されている。本研究では、これらの様々なオミックスデータから未知の薬物・標的タンパク質間相互作用ネットワークを予測するための情報技術を開発した。当日は、その応用例を紹介する。
  • 「観測データからその背後に潜むシステムを予測する遺伝子ネットワーク推定 」
    玉田 嘉紀 (東京大学大学院情報理工学系研究科コンピュータ科学専攻・ 助教)
  • 著者らは遺伝子発現データなどの観測データから遺伝子間の制御の依存関係をネットワークとして表した遺伝子ネットワークを,計算機を用いて予測・推定する手法の研究を行っている.遺伝子ネットワークを推定する手法として様々なモデルおよびその推定法が提案されているがここでは著者らが主に利用しているベイジアンネットワークを用いた手法を紹介する.ベイジアンネットワークの推定は計算が膨大なため数万遺伝子に及ぶ遺伝子ネットワーク推定への応用は非常に困難であるが,著者らはスーパーコンピュータを用いた超並列計算によって比較的短時間に計算可能なアルゴリズムを開発しヒトゲノム解析センターのスーパーコンピュータや京などのユーザに提供している.著者らはマイクロアレイによる遺伝子発現データを本手法で用いているが質的あるいは量的なデータであれば生物学的なデータに限らず基本的にどのようなデータにも適用可能である.本講演では基本的な原理およびこれまでの応用例を紹介する.
  • 「多重検定補正の再考:有意な組合せ因子の発見に向けて」
    寺田 愛花 (東京工業大学 大学院情報理工学研究科 計算工学専攻・博士後期課程)
  • ゲノムワイドな実験が行われるようになり,機能解析,転写因子のモチーフ解析,GWASなど検定に多重検定補正が必要な機会は枚挙にいとまがない.Bonferroni法に代表される多重検定補正では,検定数の増加とともに補正が厳しくなる.特に,モチーフやSNPsなどの組合せ因子の発見に適用した際に問題が表面化し,大きな差があっても有意にならないことがある.一方で,タンパク質の複合体や山中ファクターなど,生命活動において組合せで働く因子が存在することは明らかであり,実験的な結果と計算機的・統計的な結果に乖離が生じている.我々は,この原因として,既存の多重検定補正法が組合せ因子の発見を行うには厳しすぎる補正をしていることを見出した.更に,その解決手法を構築することで,統計的に有意な働きを持つモチーフの組合せ発見に成功した.本講演では,これらの問題点と解決策について紹介する.