pythonってすごいね

RNAseqを用いた遺伝子発現量解析、機械学習を用いた回帰、分類などの解析を中心に記事を書いていきたいです!

RNAseq

StringTieを用いたリード数の計算 (RNAseq)

マッピング後のSAM、BAMから、各遺伝子ごとにリード数を算出します。今回は、StringTieについてまとめてみました。 SAMファイルは重たいので、BMAファイルに変換した方が解析がしやすいと思います。 The main input of the program is a BAM file with RNA-S…

SRAからシーケンスデータをダウンロードする(RNAseq)

NCBI Sequence Read Archive (SRA) とは? Sequence Read Archive (SRA) data, available through multiple cloud providers and NCBI servers, is the largest publicly available repository of high throughput sequencing data. SRA stores raw sequenci…

SAMファイルの変換(RNAseq)

目次 マッピング後の処理(SAM、BAM)SAMファイルをBAMファイルに変換BAMファイルをBEDファイルに変換BAMファイルをソート、インデックスを付加参考 マッピング後の処理(SAM、BAM) samファイルはシーケンスリードがゲノムのどの位置にあるかを記述するファ…

Hisat2を用いたマッピング (RNAseq)

indexの作成 hisat2-build [解析対象とするゲノムfastaファイル] [保存先を指定] e.g. hisat2-build Arabidopsis_thaliana.TAIR10.dna.fa TAIR10 基本設定 シングルエンド(SE) hisat2 [options] -x [作成したindexファイル] -U [解析対象とするfastaファイ…

Fastx tool kitを用いたフィルタリング (RNAseq)

個人的にはcutadaptやtrimomaticが使いやすいと思いますが、先行研究などと合わせたい場合に使用することがあるため、Fastx tool kitに関してまとめてみました! クオリティの算出 塩基比率の算出 アダプター配列の除去 配列長の調整 クオリティが低い領域を…

Trimomaticを用いたアダプター配列の除去 (RNAseq)

目次 基本文 詳細な設定 参考 基本文 シングルエンド (SE) java -jar <trimmomatic.jarのパス> SE -threads <スレッド数> -phred33 or -phred64 -trimlog <logの保存先> <inputのパス> <outputのパス> <option> 現在は、だいたい-phred33だと思われる e.g. / java -jar trimmomatic-0.39.jar SE -threads 4 -phred33 -trimlog log.txt</option></outputのパス></inputのパス></logの保存先></trimmomatic.jarのパス>…

Tophat2を用いたマッピング (RNAseq)

目次 インデックスの作成 基本文 オプションの設定 参考 インデックスの作成 Tophat2は内部的にBowtieを使用しているため、Bowtieを用いてゲノムのインデックスを作ります。 bowtie2-build -f [対象とするゲノムのファスタファイル] [output] bowtie2-build…

cutadaptを用いたアダプター配列の除去(RNAseq)

cutadapt結構便利なんですが、ホームページの説明がとても長いので、簡略化し、まとめてみました。 cutadaptとは? シンプルな設定 詳細な設定 4.参考 cutadapt結構便利なんですが、ホームページの説明がとても長いので、簡略化し、まとめてみました。 cutad…

RNAseq解析で使うソフトウェアのリンク集

たまにRNAseq解析を行うため、覚え書きようにまとめてみました。最近ですと、ロングリードシーケンサーが出てきましたが、今回はショートリードシーケンサーを中心に書いていきます。 Contents 大まかな手順 リードのクオリティーテェック フィルタリング マ…