blast.pyスクリプトのドキュメント

概要

blast.py は指定されたFASTAファイルに含まれるシーケンスに対してBLAST検索を実行し、一致率が指定された範囲内にあるシーケンスを新しいFASTAファイルに保存するPythonスクリプトです。

使い方

コマンドラインから以下のように使用します:

python3 blast.py --email "your_email@example.com" --input "../data/input_gene.fasta" --output "../data/output_sequences.fasta" --min_identity 0.8 --max_identity 1.0

パラメータ

  • --email: NCBIへの接続に使用するメールアドレス。このパラメータは必須です。
  • --input: BLAST検索を行うシーケンスが含まれるFASTAファイルへのパス。このパラメータは必須です。
  • --output: 抽出したシーケンスを保存するFASTAファイルへのパス。このパラメータは必須です。
  • --database: 検索するNCBIデータベース。デフォルトは 'nt' です。
  • --min_identity: BLASTヒットの最小アイデンティティ(0.0から1.0の範囲)。デフォルトは0.0です。
  • --max_identity: BLASTヒットの最大アイデンティティ(0.0から1.0の範囲)。デフォルトは1.0です。

依存関係

  • Python 3
  • BioPython パッケージ

インストール

BioPythonパッケージをインストールするには、以下のコマンドを実行します:

pip install biopython

注意事項

  • 検索時間は、入力ファイルに含まれるシーケンスの数とNCBIデータベースの負荷に依存します。
  • 一致率は、シーケンスアライメントの一致した塩基の数をアライメントの長さで割った値として計算されます。

このテンプレートは基本的な情報を提供するために作成されました。必要に応じて追加の情報や詳細を追加してください。