こんにちは、ティーダです。
先日2022年4月1日のScience誌に、ヒトゲノムを初めて完全解読した論文が掲載されました。


それは凄いけど、私に関係あるの??

実は、将来的に製薬業界の皆さんにも関係する重要な発見かもしれません
そこで、今回は、このヒトゲノム完全解読について簡単に解説し、これを起点に今後ヘルスケア領域で起こるかもしれない未来の話を私視点でしていこうと思います!
可能性の話もあるので、少し抽象的ですが、頭の片隅に入れておくだけで、今後ヘルスケア業界で起こる事業やビジネスにも敏感になれると思います!
今回は該当論文と論文を日本語で解説している以下のレビューを参考にしました!
清水 厚志, ヒトゲノム計画とヒトゲノム完全解読, JSBi Bioinformatics Review, 2022, 3 巻, 1 号, p. 11-19
https://www.jstage.jst.go.jp/article/jsbibr/3/1/3_jsbibr.2022.primer2/_html/-char/ja
そもそもヒトゲノムは全て解読されてなかったの?
まずは、前提条件の話をしましょう!

そもそも、ヒトゲノムって完全には分かってなかったの??
という方も多いと思います。
(私も近年までは全部分かっていると思ってました笑)
よく色んな発表のイントロとかで、「ヒトゲノムは解読された!」みたいな話を聞くので、「へ〜全部解読されてるんだ〜」って思ってました。
実際に、1990年から始まったヒトゲノム解析プロジェクトは、2003年には一旦は解読完了とされていました。
しかし、当時の技術では解読困難な部分があったため、解析は完璧とは言えず、全長の約15%が欠けた状態での完了宣言でした。
現在も、皆がバイオインフォ解析で使用しているレファレンス配列でも約8%は不明のままで残っていました。

全体の8%って結構分かってないな!!
どのへんが、なんで読めてなかったの??
これまで塩基配列が解読できなかった部分は、染色体の末端部「テロメア」や中央部「セントロメア」の周辺です。
従来の方法は、読んだ短い配列を前後の相同性などからジグソーパズルのように組み合わせていく方法でした。
そのため、繰り返し配列が多い「テロメア」や「セントロメア」では上手く組み合わせることが出来ず解読が困難でした。

ヒトゲノム解読に繋がったブレイクスルー
そこで、テロメア・トゥ・テロメア (T2T) コンソーシアムが2018年に結成され、最新技術を駆使して残り部分の解読が行われました。
このT2Tコンソーシアムの活動を最も後押ししたのが、次世代型シーケンサー (NGS) の開発です!
以下で簡単に「従来法」と「新たな方法」の概要と違いを解説します。 (概略は以下図)

従来法:階層的ショットガン法
従来法では、階層的ショットガン法を選択しました。
これは、ゲノムDNAをbacterial articial chromosome (BAC) に一旦クローニングし、増殖させた後に別のベクターに導入して、シークエンシングを行います。(上図左)
その後、読み取った配列をパズルのように組み合わせて配列を再構成します。
- 大腸菌内で組み換えを起こしやすい反復配列で、欠失を起こしやすく、正しい配列が得られない
- 反復配列などで、配列の類似性が高い場合、上手く再構成出来ない

この方法はクローニング実験でよく使われているからイメージしやすいですね!
新たな解読法:NGSの活用
こちらの解析の主役はなんといってもNGSです!!
従来法で解読出来なかった部分を解読するために、当時の最新技術を組み合わせて解析がされています!
今回のヒトゲノム完全解読では、種々あるNGSのうち
- Illumina社の短鎖リードシークエンス
- PacBio社のHiFi
- オックスフォードナノポア社の超長鎖シークエンス (MinION)
のデータが主に活用されました。
まず、クローニング困難な領域については、Illumina社の短鎖リードシークエンスで解読されていきました。
一方で、反復配列を含む類似性の高い部分 (テロメアなど) については、高精度かつ反復配列を上回る長さのシークエンス長を必要としたため長鎖型シークエンサーを活用しました。
Illumina社などの1000bp以下までしか読まないシークエンサーを「短鎖型」と呼ぶ一方で、「長鎖型」と呼ばれるHiFi、MinION等では10~25kbpを一度に読むことが可能です!
以下の本に詳しく載っているのでオススメ!
さらに、同一DNA分子の遠距離間の相互作用を調べるHi-C等の技術を利用して、多型を特定していきました。
最終的には、3.05Gbpの核DNAと16569bpのミトコンドリアDNAからなるヒトゲノムが完全に解読されました。
解析に使用した検体も、ヒトゲノム解析プロジェクトではボランティアからの提供でしたが、T2Tでは全胞状奇胎を利用しています。
全胞状奇胎は、何らかの原因で核が抜けてしまった卵子に精子が受精することで発生する異常妊娠であり、ヒトの形を留めず、細胞には精子が運んでいた23本の染色体しか含まれていません。
そのため、対となる染色体すべての配列が同一となり、ヒトゲノム解析に向いていました。
ヒトゲノム完全解読によって起こりうること
遺伝性疾患の機序解明や解析精度向上
T2Tコンソーシアムは、ヒトゲノム配列の完全解明によって
- 新規の200万以上の変異を発見
- 疾患に関連する622の遺伝子バリアントを発見
これは、将来的に、「遺伝子変異が影響する疾患のメカニズム解析」や、「個人ごとの疾患発症リスクの予測」など様々な点に応用されることが期待されます。
多層オミックス解析の深化
当たり前ですが、ゲノムはあらゆるオミックス解析の原点になります。
近年では、「多層オミックス解析」と呼ばれる、複数のオミックスを複合的に解析することで、疾患等のメカニズム解析を進めています。
今回ゲノミクス領域で起こったブレイクスルーは時間をかけて、より下流のトランスクリプトームやプロテオーム、メタボロームまで波及するでしょう。
そうすると、多層オミックス解析を用いて疾患メカニズムの解析をしていた研究者にとっては非常に大きな変化が起こる可能性があると思います。
これによって、新たな創薬ターゲットタンパク質やターゲットパスウェイが生まれることを期待しています。

若輩者の私ではなかなか創薬に直接結びつかせることは出来ませんでした笑
最後に
今回は、ヒトゲノム完全解読に関する報告を創薬研究者の目線から解説してきました。
オミックス解析をしている研究者は学んでおいて損はない歴史的に重要な出来事であることは間違いないでしょう!
少し前から100ドルで全ゲノムが解読出来るという話が聞こえています。
ヒトゲノム完全解読がなされたことで、今後益々値段が下がり、100ドルで個人ゲノム完全解読もあるかも知れません。
その場合、個人の疾患発症リスクなどをかなり正確に予測出来るツールが出るかも知れませんね!
そんな画期的なヘルスケアビジネスが出てくることに期待です!
最後まで読んで頂きありがとうございました!
コメント