【最初に絶対見て!!】独学でバイオインフォマティクスを始める人が最初にすべきこと

独学でバイオインフォマティシャン バイオインフォ入門

こんにちは、ティーダです。

近年、バイオ関連研究をする上で、膨大な解析データを活用して生命現象を解明する取り組み (バイオインフォマティクス、ドライ研究) が普及してきています。

ウェット実験 (従来)ドライ実験 (新規) について例示してみます。

  • ウェットの生物実験 (従来) :
    ELISA、フローサイトメーター、免疫染色、ウエスタンブロット、動物での病態評価モデル etc…
  • ドライの生物実験 (最近増えてる) :
    NGSデータ解析、画像解析、動画解析、in silicoタンパク構造解析 etc…

例えば、従来はフローサイトメーター (FACS) で細胞に発現するタンパク質を1つずつ抗体で染色して見ていました。

しかし、NGS技術の発展で、1細胞レベルで全てのmRNAやタンパク質を網羅的に検出することが可能になっています。(single cell RNA-seq, CITE-seq, etc…)

今後、ウェット実験を主体とする研究者もバイオインフォマティクスを活用したり、理解することが必須になってくると思います。

この記事では、バイオインフォマティクスを独学で勉強する方法を、私の経験も踏まえて解説します。

他にもバイオインフォの記事を書いているので是非参考にしてください!

 



そもそもバイオインフォマティシャンとは?

バイオインフォマティシャンになりたいけど、具体的なイメージが出来てないな〜

確かに、ウェット研究を中心にしてきた人からすると何やってるのかよく分からないよね!

バイオインフォマティシャンとは以下のように定義できます。

「ゲノムをはじめとする生体分子の構造・変化・挙動をコンピュータにより数値化し、生理的な情報と共に解析し、関連する生活や医療の改善方法を導き出す職種」
(参考:https://www.crecon.co.jp/services/bioinformatics/

具体的にバイオ研究では、

  • オミックスデータ解析 (mRNA, DNA, タンパク質 etc…)
  • 疾患動物の行動についての動画解析
  • 免疫染色データの画像解析
  • タンパク質の構造解析 (AlphaFold2 etc…)
  • 医療ビッグデータの解析

などの種々の技術に1つでも精通していればバイオインフォマティシャンと言えます。

さらに、バイオインフォマティシャンはレベルでも分けられます。

Level 0:バイオインフォで解析されたデータを見て、理解出来る
Level 1:教えてもらった一通りのバイオインフォツールを使って、自分のデータを解析出来る
Level 2:新しいバイオインフォツールを独学で学んで、自分の研究に活用出来る
Level 3:自分の研究に必要なバイオインフォツールを新たに開発して、自分の研究に活用できる

この中でも、ウェット研究を専門としてるバイオインフォマティシャンだったら、Level 2まで習得できれば十分です。

Level 3はそもそも研究自体を情報系から始めている人が多く、情報技術の専門家が多いです。

今回は最も一般的である「NGSを活用したオミックス解析をするバイオインフォマティシャン」になるための勉強法について解説を進めています。

Step.0:勉強前に知っておくべきこと

まず勉強を始める前に心得ておくことは、以下の2点です

高額プログラミング教材は不要!!

実は私も最初にバイオインフォの勉強を始めるときに、何を勉強するべきか分からず、テックキャンプというプログラミングスクールに通ってしまいました。(約25万円かかりました)

しかし、テックキャンプで学んだこと全てが別のサイトを使えば、「無料」か「1000円位」で学べる内容でした。。。。

というか、一般的なプログラミングとバイオインフォとは少し勉強方法が異なります。

なので、最初は高額スクールには絶対に通わないでください!

もし上達して、必要と感じたら考えた方がいいと思います。

完全には理解・暗記しなくてもどんどん進んでOK

始めるとプログラミングのコマンド (Unix, Python) を覚える必要が少しだけあります。

しかし、以下で紹介する動画プログラムでは言われた通りにキーボードを叩くだけで、なんとなく結果は出ます。

なので、コマンドはほとんど覚えなくていいですし、プロセスとかも完全には理解しなくて大丈夫です!

やっている内に勝手に覚えられますし、理解できます!!

とりあえず、不完全な状態でどんどん進んで、どんどん解析していくのが上達への近道です!!

Step.1:はじめの一歩!

まずは「Mac Book」「RNA-Seqデータ解析 WETラボのための鉄板レシピ」を買いましょう!!

なぜMacなのか?

Macに入っているUnixというOSを使用するとバイオインフォ解析が非常にやりやすいからです!

WindowsのPCを使っている場合はUnixを使用できるOSをインストールしないといけないので、一手間かかります。

出来れば解析を始める場合はMacを購入しましょう!!

バイオインフォでは、PythonとかRとか色々なプログラミング言語を使うイメージですが、実は最初にバイオインフォで使用するのはUnixのコマンドです!!

PythonやRは数値データにした後のデータ処理で使用することが多いです。

なぜ「RNA-Seqデータ解析 WETラボのための鉄板レシピ」なのか?

こちらの本は

  • PCの初期設定
  • RNA-seqの生データ ⇒ Excelデータまでの一通りの解析流れ
  • 解析する上での気をつけるべきポイント
  • バイオインフォ関連の小話

を細かく教えてくれる素晴らしい本になっているからです。

ここに書いてるPC設定を完全にマネして、書いてある通りのプロセスを実行するだけでRNA-seqデータを一通り解析出来るようになります。

Step.2:バイオインフォ勉強開始の三種の神器!!

RNA-Seqデータ解析 WETラボのための鉄板レシピ

上記でも紹介したRNA-Seqデータ解析 WETラボのための鉄板レシピ」を買えば最初の準備は問題ないです。

全て書いてあるとおりに始めましょう!

ここで使用するのは主にUnixです。

Unixで分からないコマンドなどがあったらググると一覧にまとまったものが出てきます!
基本は本で解説してくれています。

Paizaラーニング Python3入門編

Paizaラーニングというプログラミング学習サイトの「Python3入門編」を一通り実施すれば、「完全初心者」から「Pythonを使える人」まで2週間程度でなることが出来ます!

Python3入門編
この入門講座ではPythonの基本を環境構築不要で短時間で学ぶことができます。データサイエンスやAI,Webアプリケーション開発を学びたい方を対象に予備知識なく活用いただけます。

これをオススメする理由は以下です。

  • 完全無料
  • PC環境の構築が不要
  • 動画形式で教えてくれる
  • 完全初心者に対して解説が始まる

Unixを始めるのと平行でPythonを学んでおくと、後々で便利なので是非受けてください!

Udemy 実践 Python データサイエンス

こちらはさらにPythonを実践的に学ぶことが可能な動画形式のプログラムです。

PandasやNumpyといった今後の解析で必ず使用するツールの解説もしてくれるので、こちらも受けることを勧めます!

【世界で18万人が受講】実践 Python データサイエンス

定価で購入すると1万円位するので、90%オフセールで、1000円で買えるタイミングを狙って購入しましょう!

また、こちらのプログラムは完全に最後までは受けきらなくても十分です。
ある程度基本的な項目を受け終わったら受講をやめても構いません!



追加の学習方法

理解が進んできたら書籍を読んで勉強していくのも良いと思います。

個人的にオススメなのは以下の書籍です

タイトル通り、ほぼ独学でPythonを用いたバイオインフォ解析が可能になります。

こちらは、かなり初歩の「Linuxとは?」からロングリードシーケンスまで幅広い内容を扱った書籍です。

基本がある程度身についている方はコレを読んで、次のやりたいことを見つけられると思います。

最後に

① RNA-Seqデータ解析:
WETラボのための鉄板レシピを購入して、書いてあるとおりのツールをダウンロードして、テストデータ (公共データ) を解析する

② データ加工・グラフ化:
Pythonを勉強して、①で出したデータを加工/グラフ化する

上記の2点をこなせればある程度のことは出来るようになります。

これ以上は①②で学んだことの応用なので、都度Googleで調べて進めていけば十分です!

是非バイオインフォマティシャンとして研究を始めましょう!

今後より詳しい勉強方法も記事にしていきます!

【絶対読むべきの書籍紹介】

バイオインフォ入門
スポンサーリンク
ティーダをフォローする
ティーダの製薬業界研究blog ~製薬の全てをそこに置いてきた~

コメント

タイトルとURLをコピーしました