研究活動
Research Activities

研究活動
Research Activities

Home › 研究活動 › 研究成果 › マウス初期胚の形態を遺伝子発現情報のみから再構築する新たな3次元モデルの開発に成功

研究成果 
Publications

2019年8月29日

マウス初期胚の形態を遺伝子発現情報のみから再構築する新たな3次元モデルの開発に成功

ポイント

  1. 計算機とAI(人工知能)注1)を用いることで、18個の遺伝子の情報のみから、マウス初期胚の3次元形態を再現するモデルの作製に成功した。
  2. 今回の3次元モデルの構築によって、組織の形態形成に重要な遺伝子の種類を同定することができた。
1. 要旨

 森智弥助教(京都大学化学研究所バイオインフォマティクスセンター数理生物情報、元京都大学CiRA増殖分化機構研究部門)、藤渕航教授京都大学CiRA未来生命科学開拓部門)らの研究グループは、マウスの初期胚における個々の細胞の遺伝子発現の情報をもとに、その3次元形態を計算機上で再構築する新たなモデルを開発しました。これにより、オルガノイド注2)などiPS細胞から作製した人工組織の品質特性の解析などに貢献できると期待されます。

 この研究成果は2019年8月29日に英国科学誌「Scientific Reports」でオンライン公開されました。

2. 研究の背景

 iPS細胞から3次元の組織を作り出すことは、再生医療分野における大きな研究テーマのひとつです。3次元の組織を作り出すためには、生物の発生過程において、1つ1つの細胞がどのようなふるまいをしているのか理解することが重要です。近年、生物の発生過程の理解のために、3次元的に発生過程を解析する方法がいくつか開発されてきましたが、その多くは、それぞれの細胞の空間的な位置に関する情報と、その細胞でどの遺伝子が特徴的に発現しているのかという情報を必要としており、実験データを揃えるのに手間がかかります。そこで本研究では、計算機とAIを用いることで、遺伝子発現情報のみを基にしてマウス胚の形態を再現する3次元モデルの構築に取り組みました。

3. 研究結果

 モデルの構築には、他の研究グループによって得られたマウス原腸胚注3)の遺伝子発現に関するデータを用いました(Peng et al., 2016)。このデータには、41の組織断片から得られた約23,000個の遺伝子の発現に関する情報が含まれており、発現している遺伝子の種類から、マウスの組織が4つの主要なドメイン注4)に分けられることが報告されています。このデータにおける遺伝子の数が多すぎて実際のシミュレーションに適さないため、研究グループは、3次元形態の構築に最適な遺伝子の組合せを確率的自己組織化マップ(Stochastic SOM:Stochastic Self-Organizing Map)注5)と呼ばれるAIを用いて選び出すことに取り組みました(図1)。

図1 本研究の概要。Peng et al. (2016) が発表した受精7日目のマウス原腸胚の遺伝子発現に関するデータを、遺伝子情報のデータベースであるGEO(Gene Expression Omnibus)注8)からダウンロードしてモデル構築に用いた。41の組織断片サンプルから得られた20,000個以上の遺伝子の発現情報から、発現量の多い5,585個の遺伝子を抽出した。さらに、Gene Ontology注9)という遺伝子を機能によって分類しているデータベースから、この5,585個の遺伝子が3個以上1,000個以下含まれる機能グループを抽出した。そして、確率的自己組織化マップによってモデル構築に最適なグループの組み合わせを見出すことで、マウスの原腸胚の体を形成する4つの主要なドメインを立体的に再現することに成功した。

 具体的には、はじめに、約23,000個の遺伝子のうち、2サンプル以上で十分に発現量がある5,585個の遺伝子を選び出しました。さらに、Gene Ontologyというプロジェクトによって記録されている遺伝子の機能に関する分類データを基に、この5,585個の遺伝子が3個以上1,000個以下含まれる遺伝子機能グループを6,778抽出しました。そして、マウスの形態形成をよく再現できるグループの組み合わせを確率的自己組織化マップによって選び出すことを試みました。確率的自己組織化マップによって、組織の3次元モデルにおいてそれぞれのグループを機能させたときに、実際の胚における4つのドメインに分かれるかどうかを試行することができます。

 まず、1つのグループのみを用いた場合で3次元モデルの構築(モデリング)の成功率を調べたところ、GO: 0060412というグループを用いた場合にモデリングの成功率が84%と最も高いことがわかりました(図2a)。そこで、GO: 0060412と、他の1つのグループとのペアで同様にモデリングを試したところ、22のグループとのペアではモデリングの成功率が85%以上になり、最高で95%になることがわかりました(図2b)。さらにGO: 0060412とこれらの22のグループのうち4つを組み合わせた、合計5のグループを用いて同様に試したところ、最高で99%になることがわかりました。これらのグループは合計20個の遺伝子から構成され、これまでの報告により、発生や形態形成に関係していると言われているものが非常に多く含まれていました。

図2 a:1種類の遺伝子グループを機能させたときのモデリングの成功率(横軸)と分散(縦軸)。
青い点はそれぞれの遺伝子グループを示す。

b:GO: 0060412ともう1つの遺伝子グループのペアを機能させたときのモデリングの
成功率(横軸)と分散。青い点はペアになったそれぞれの遺伝子グループを示す。

 最後に、この20個の遺伝子から不要な遺伝子を除くため、遺伝子を1個ずつ削除してモデリングの成功率を試したところ、最終的に2個を削除した18個の遺伝子の組合せによって、100%の確率でモデリングが可能になることが明らかになりました。

4. 本研究の意義と今後の展望

 従来、生物の発生過程の3次元解析においては、細胞の空間的な位置に関する情報と、それぞれの細胞における遺伝子発現に関する情報の両方が必要でした。本研究では、遺伝子発現情報のみを用いて、発生初期のマウスの形態を計算機上で3次元的に再現するモデルの開発に成功しました。また、3次元形態の再構築を通じて、形態形成に重要と考えられる遺伝子の種類を同定することができました。

 今後は、さまざまな組織に対して同様の手法を応用することで、生物の発生に関する理解が進み、iPS細胞から人工的に作製したオルガノイドの品質解析やさまざまな組織を分化させる方法の確立に役立つ可能性があります。

5. 論文名と著者
  1. 論文名
    "Novel computational model of gastrula morphogenesis to identify spatial discriminator genes by self-organizing map (SOM) clustering"
  2. ジャーナル名
    Scientific Reports
  3. 著者
    Tomoya Mori1,3, Haruka Takaoka2, Junko Yamane1, Cantas Alev1 & Wataru Fujibuchi1*
    *:責任著者
  4. 著者の所属機関
    1. 京都大学 iPS細胞研究所(CiRA)
    2. 前橋工科大学工学部生命情報学科
    3. 京都大学化学研究所(現所属)
6. 本研究への支援

本研究は、下記機関より資金的支援を受けて実施されました。

  1. AMED 再生医療実現拠点ネットワークプログラム iPS細胞研究中核拠点
  2. iPS細胞研究基金
7. 用語説明

注1)AI(人工知能)
計算機を用いて人間の知的な活動である言語認識や推論、創造などを行う技術。

注2)オルガノイド
多能性幹細胞や組織幹細胞から分化誘導された3次元組織で、生体でみられるような構造や機能を保持しているもののこと。神経領域では、大脳、神経網膜、小脳、海馬、中脳、視床、脊髄などの領域が報告されており、神経以外では、腎臓、胃、肝臓、腸管などのオルガノイドが報告されている。いずれも将来的な疾患モデリングや創薬スクリーニングへの応用が期待されている。

注3)原腸胚
動物発生初期において胞胚に続いて見られる段階で、原腸が形成され胚葉の分化が起こる時期である。

注4)ドメイン
組織を形成する細胞集団のうち、同様な性質を持つ細胞塊や層のこと。

注5)確率的自己組織化マップ(Stochastic SOM:Stochastic Self-Organizing Map)
自己組織化マップは人工知能における機械学習の一種である。ヒトの大脳皮質における視覚野をモデルとしてコホーネンによって提案されたモデルであり、教師なし学習によってデータを任意の次元に射影する。この次元に複数の人工ニューロンを配置し、これをユニットもしくはノードと呼ぶ。学習過程において1つのみのニューロンを学習するのでなく近傍のニューロンも同時に学習させることで、ヒトの大脳皮質における学習領域を模倣すると考えられている。

注6)レーザーマイクロダイゼクション
顕微鏡下で組織切片を観察しながら、切片上の標的細胞塊をレーザーによって切り出す技術である。生体組織から標的細胞群のみを採取することができるため、組織を構成する様々な細胞のうち、特定の遺伝子がどの細胞にどれだけ発現しているのかを物理的な位置と関連づけて知ることができる。

注7)RNAシーケンス
細胞でRNAに転写されている遺伝子を採集しその塩基配列を読み取る技術。これを用いることで、どのような遺伝子集団が細胞内で発現していたのか、その種類と量を特定することが可能である。

注8)GEO(Gene Expression Omnibus)
米国立衛生研究所バイオテクノロジー情報センターで開発された遺伝子発現データを収集したデータベース。世界中から登録されたデータが搭載され、雑誌によっては論文に使用した遺伝子発現データをこのデータベースに登録することが義務付けられている。

注9)Gene Ontology
生物学的概念に基づいて遺伝子を分類する体系のこと。大きく「生物学的プロセス」、「細胞構成要素」、「分子機能」の3カテゴリーがあり、それぞれに多数の生物学的概念に基づく遺伝子が分類されている。本来Ontologyとは哲学用語で「存在論」という意味である。

go top