reciprocal_smallest_distance

Software screenshot:
reciprocal_smallest_distance
Podrobnosti Software:
Verze: 1.1.5
Datum uploadu: 20 Feb 15
Licence: Volný
Popularita: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance je po dvou orthology algoritmus, který používá globální srovnání sekvencí a maximum pravděpodobnosti evoluční vzdálenost mezi sekvencemi přesně detekuje ortology mezi genomů.
Instalace Z tarballu
Stáhněte si a untar nejnovější verzi z GitHub:
cd ~
curl -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Instalace reciprocal_smallest_distance, ujistěte se, že používáte Python 2.7:
CD reciprocal_smallest_distance-VERZE
python setup.py nainstalovat
pomocí RSD najít Othologs
Následující příklad příkazy ukazují hlavní způsoby, jak spustit rsd_search. Každé vyvolání rsd_search vyžaduje zadání umístění sekvencí souboru FASTA formátu pro dva genomy, nazvaný dotaz a na něž genomy. Jejich pořadí je libovolný, ale pokud použijete volbu --ids, musí IDS pocházet z genomu dotazu. Musíte také zadat soubor pro zápis výsledků ortology zjištěných RSD algoritmem. Formát výstupního souboru obsahuje jednu ortolog na řádek. Každý řádek obsahuje dotazu sekvence id, předmět sekvence id, a vzdálenost (vypočtené codeml) mezi sekvencemi. Volitelně můžete zadat soubor, který obsahuje ID pomocí volby --ids. Pak RSD vyhledá pouze ortology pro tyto ID. Použití --divergence a --evalue, máte možnost využít různé prahové hodnoty z výchozí hodnoty.
Požádejte o pomoc o tom, jak spustit rsd_search, rsd_blast, nebo rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Najít ortology mezi všemi sekvencemi v dotazu, a na něž genomů, za použití standardní divergence a evalue prahy
příklady rsd_search -q / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Najít ortology pomocí několika non-výchozí divergence a evalue prahy
příklady rsd_search -q / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0.2 1e-20 --de 0,5 0,00001 --de 0.8 0.1
Není nutné formátovat soubor FASTA pro vysoké nebo spočítat BLAST narazí, protože rsd_search to udělá za vás.
Pokud však máte v plánu provozovat rsd_search vícekrát za stejné genomy, zejména u velkých genomů, můžete ušetřit čas pomocí rsd_format k preformatting se Fasta soubory a rsd_blast na precomputing BLAST hity. Při spuštění rsd_blast, ujistěte se, že používáte --evalue stejně velké jako největší práh evalue máte v úmyslu dát rsd_search.
Zde je, jak formátovat pár Fasta souborů na místě:
rsd_format -g examples / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
A tady je, jak formátovat FASTA soubory, uvedení výsledky v jiném adresáři (aktuální adresář v tomto případě)
rsd_format -g examples / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Zde je, jak vypočítat vpřed a vzad výbuch hity (výchozí evalue):
rsd_blast -v -q examples / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hity q_s.hits --reverse-hity s_q.hits
Zde je, jak spočítat dopředu a vzad výbuch hity pro rsd_search pomocí genomy, které již byly ve formátu pro tryskové a non-výchozí evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
--forward-hity q_s.hits --reverse-hity s_q.hits
-no-format --evalue 0,1
Najít ortology mezi všemi sekvencemi v dotazu a předmětových genomů pomocí genomy, které již byly ve formátu pro tryskové
rsd_search -q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
-no-format
Najít ortology mezi všemi sekvencemi v dotazu a předmětových genomů pomocí hity, které již byly vypočteny. Všimněte si, že -no-format je v ceně, protože od té doby se vysokých hity již byly vypočteny genomy nemusí být formátován pro výbuch.
rsd_search -v --query genom Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hity q_s.hits --reverse-hity s_q.hits -no-formát
Najít ortology pro specifické sekvence v genomu dotazu. Pro zjištění ortology pouze pro některé sekvence, pomocí --no-výbuch-cache může urychlit výpočty. YMMV.
příklady rsd_search -q / genomy / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = examples / genomy / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o examples / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids příklady / Mycoplasma_genitalium.aa.ids.txt --no-výbuch-cache
Výstupní formáty
Orthology mohou být uloženy v několika různých formátech pomocí --outfmt možnost rsd_search. Výchozí formát, --outfmt -1, se odkazuje na --outfmt 3. INSPIROVÁNO UniProt DAT soubory, sada ortology začíná parametry linky, pak má 0 nebo více ortolog linek, pak má koncovou čáru. Tyto parametes jsou název dotazu genom, předmět název genom, práh divergence, a práh evalue. Každý ortholog je na jednom řádku výpisu dotazu sekvence id, předmětné sekvence id, a maximální odhad pravděpodobnosti vzdálenosti. Tento formát lze reprezentovat ortology pro více sad parametrů v jediném souboru, stejně jako sady parametrů s žádnými ortology. Proto je vhodný pro použití s ​​rsd_search při zadávání více divergence a evalue prahy.
Zde je příklad obsahující 2 kombinace parametrů, z nichž jeden má žádné ortology:
PA tLACJO tYEAS7 t0.2 t1e-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Původní formát RSD, --outfmt 1, je k dispozici pro zpětnou kompatibilitu. Každý řádek obsahuje ortolog, reprezentován jako sekvence předmět id, dotazu sekvence id, a maximální odhad pravděpodobnosti vzdálenosti. To může představovat pouze jednu sadu ortology v souboru.
Příklad:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Také pokud pro zpětnou kompatibilitu je formát používaný interně Roundup (http://roundup.hms.harvard.edu/), který je stejně jako původní formát RSD, s výjimkou sloupci ID sekvence dotaz před sekvenční předmět id.
Příklad:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Požadavky na :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2.04

Podobný software

avalanchetoolbox
avalanchetoolbox

14 Apr 15

SSuMMo
SSuMMo

14 Apr 15

Pathomx
Pathomx

17 Feb 15

E-Cell System
E-Cell System

11 May 15

Komentáře k reciprocal_smallest_distance

Komentáře nebyl nalezen
Přidat komentář
Zapnout obrázky!