pythonってすごいね

RNAseqを用いた遺伝子発現量解析、機械学習を用いた回帰、分類などの解析を中心に記事を書いていきたいです!

2020-08-01から1ヶ月間の記事一覧

Trimomaticを用いたアダプター配列の除去 (RNAseq)

目次 基本文 詳細な設定 参考 基本文 シングルエンド (SE) java -jar <trimmomatic.jarのパス> SE -threads <スレッド数> -phred33 or -phred64 -trimlog <logの保存先> <inputのパス> <outputのパス> <option> 現在は、だいたい-phred33だと思われる e.g. / java -jar trimmomatic-0.39.jar SE -threads 4 -phred33 -trimlog log.txt</option></outputのパス></inputのパス></logの保存先></trimmomatic.jarのパス>…

Tophat2を用いたマッピング (RNAseq)

目次 インデックスの作成 基本文 オプションの設定 参考 インデックスの作成 Tophat2は内部的にBowtieを使用しているため、Bowtieを用いてゲノムのインデックスを作ります。 bowtie2-build -f [対象とするゲノムのファスタファイル] [output] bowtie2-build…

cutadaptを用いたアダプター配列の除去(RNAseq)

cutadapt結構便利なんですが、ホームページの説明がとても長いので、簡略化し、まとめてみました。 cutadaptとは? シンプルな設定 詳細な設定 4.参考 cutadapt結構便利なんですが、ホームページの説明がとても長いので、簡略化し、まとめてみました。 cutad…

データフレームの条件分岐 (pandas)

pandasでは、if文のように、カラムの値に応じて任意の領域を選択、取り出す事ができます。 import pandas as pd #使うパッケージをimportする from sklearn.datasets import load_iris iris = load_iris() df = pd.DataFrame(iris.data, columns=iris.featur…

博士課程に進む前に知っておけば良かったこと(3つ)

私自身が博士課程に進む際、情報の少なさに苦労した事があったため、少しでも役立てればと思い、博士課程に進む前に知っておけば良かった事を簡単にまとめてみました。 Contents そもそも博士課程とは? 研究は政治的な力が大きい場合がある 博士100人の…

pythonを使った多重比較検定補正

pythonのパッケージの一つである、statsmodelsを使うことで、多重比較検定補正を行う事ができます。 なぜ、多重比較検定補正が必要? 例えば、有意水準を5%とし、3回の検定を行った場合、どれか一つが有意になる確率は1-全てが有意ではない確率=1-(0.95)3=…

ポストドクターの先輩達を見て感じたこと(個人的感想)

私自身、博士を取得後は、企業に就職しました。しかし、最後まで一般企業に就職するか、ポストドクターをするか迷いました。 博士課程を目指す方に、少しでも役立てればと思い、ポストドクターをやられている方々を見て、思った事をまとめました。 Pyてよん …

バイオ系の解析でよく使うpythonのパッケージ集(個人的感想)

pythonを始めたばかりの人に役立てればと思い、バイオ系の解析でよく使うパッケージをまとめました。 Contents Pandas Numpy Scipy Statsmodels (FDR 検定など) Matplotlib or Seaborn Pandas 生物系の解析だとデータフレーム形式(エクセル表など)を取り扱…

TOEIC850点を超えるまでにしたこと

私の能力 中学生の頃、英語ができなくて先生に怒られるセンター試験の英語6割ぐらい初めてのTOEICはちょうど500点 使った教材 新公式問題集 https://www.amazon.co.jp/gp/product/4906033466/ref=as_li_qf_asin_il_tl?ie=UTF8&tag=daueno-22&creative=12…

ESを書く際に気をつけた3つのこと (バイオ系博士の就活)

まず、いろいろなESの書き方に関する本を読んだ結果 だるまさん 情報が多すぎて、結局何を書いていいのかがわからない。。。 よく物語には、起承転結がありますが、自分なりに、ESを書く際に意識した起承転結をまとめました! Contents これまで、自分は何を…

BigWig→Wig→Bedに変換する (File 形式変換)

Bam形式からBigWig形式に変換する方法は多く見ましたが、BigWig形式をbed形式に変換する情報が少なかったのでまとめて見ました。 そもそも、Wig file とは? WIGフォーマットはGC含量やprobability scoresやトランスクリプトームデータなどのような密で連続…

Python学んで人生変わった(バイオ系博士)

大学院に入るまでの私の能力 大学時代まで体育学部(脳みそ筋肉じゃないと信じたい笑)プログラミング言語なんて聞いたこともなかったパソコン苦手のバリバリの文系 今回の内容 私は、学部生の頃はスポーツ科学を学んでおり、大学院から専攻を基礎生物学に変…

バイオ系の解析で使う統計検定 (python)

Contents student's t-test welch's t-test Mann-WhitneyU 検定 カイ二乗検定 Kolmogorov–Smirnov 検定 参考にしたサイト student's t-test (two-side) [1] 2つのデータ間に対応がない[2] データが正規分布である (パラメトリック)[3] 平均値の比較[4] 分…

RNAseq解析で使うソフトウェアのリンク集

たまにRNAseq解析を行うため、覚え書きようにまとめてみました。最近ですと、ロングリードシーケンサーが出てきましたが、今回はショートリードシーケンサーを中心に書いていきます。 Contents 大まかな手順 リードのクオリティーテェック フィルタリング マ…

インデックスの選択・インデックスの再設定 (pandas)

pythonのパッケージをimportする from sklearn.datasets import load_iris import pandas as pd データを表示する iris = load_iris() #テストデータとしてirisをロード df = pd.DataFrame(iris.data, columns=iris.feature_names)#データフレームを作成 col…

リスト内表記とは?

私自身、これまでも、これからも使うかはわかりませんが、リスト内表記についてまとめたいと思います。 まず、リスト内表記とは??? こんな感じです↓ a=[True if i >4 else False for i in range(10)] 正直、初めて見た時はpythonだと思えませんでした(笑…