pythonってすごいね

RNAseqを用いた遺伝子発現量解析、機械学習を用いた回帰、分類などの解析を中心に記事を書いていきたいです!

2020-09-01から1ヶ月間の記事一覧

シングルセル解析におけるCSVファイルの取り込み(scanpy)

シングルセル解析を行う際、scanpyを使った解析をよく見ます。その中で、CSVファイルを取り込む方法が、情報として少なかったため、まとめて見ました。 通常の解析に関しては、【Python】Scanpyを使った single cell RNA解析 - ばいばいバイオに詳しく書かれ…

StringTieを用いたリード数の計算 (RNAseq)

マッピング後のSAM、BAMから、各遺伝子ごとにリード数を算出します。今回は、StringTieについてまとめてみました。 SAMファイルは重たいので、BMAファイルに変換した方が解析がしやすいと思います。 The main input of the program is a BAM file with RNA-S…

SRAからシーケンスデータをダウンロードする(RNAseq)

NCBI Sequence Read Archive (SRA) とは? Sequence Read Archive (SRA) data, available through multiple cloud providers and NCBI servers, is the largest publicly available repository of high throughput sequencing data. SRA stores raw sequenci…

SAMファイルの変換(RNAseq)

目次 マッピング後の処理(SAM、BAM)SAMファイルをBAMファイルに変換BAMファイルをBEDファイルに変換BAMファイルをソート、インデックスを付加参考 マッピング後の処理(SAM、BAM) samファイルはシーケンスリードがゲノムのどの位置にあるかを記述するファ…

Hisat2を用いたマッピング (RNAseq)

indexの作成 hisat2-build [解析対象とするゲノムfastaファイル] [保存先を指定] e.g. hisat2-build Arabidopsis_thaliana.TAIR10.dna.fa TAIR10 基本設定 シングルエンド(SE) hisat2 [options] -x [作成したindexファイル] -U [解析対象とするfastaファイ…

Fastx tool kitを用いたフィルタリング (RNAseq)

個人的にはcutadaptやtrimomaticが使いやすいと思いますが、先行研究などと合わせたい場合に使用することがあるため、Fastx tool kitに関してまとめてみました! クオリティの算出 塩基比率の算出 アダプター配列の除去 配列長の調整 クオリティが低い領域を…

博士課程に向いているなと思った人の特徴を挙げてみた

主体的に物事を考えられる 一般的にどのような事をする際も主体性は大切です。特に、博士課程に行く場合、指導教員の方はずっと側にいる事は少ないので、自分で考え、自分で行動する習慣が必要となってきます。 金銭的面に不安がない、もしくは余裕がある 博…

博士の学位取得に必要だと思った心得

博士課程の学位を取得する上で、大事だと思った習慣を箇条書きしました。(とても当たり前のことが多いです) 全ての意見を聞かない 他人の意見を聞くことは、とても重要ですが、全ての意見を聞く必要はないと思います。特に、博士学生だと教授などの指導教…