Burrows-Wheeler Aligner (BWA) je účinný program, který vyrovnává relativně krátké nukleotidové sekvence proti dlouhé referenční sekvencí, jako je například lidského genomu.
Software implementuje dva algoritmy, Bwa-krátký a BWA-SW. Dřívější práce pro dotaz sekvence kratší než 200bp a druhý pro delší sekvence až kolem 100kbp.
Oba algoritmy dělat gapped zarovnání. Oni jsou obvykle přesnější a rychlejší na dotazy, s nízkou mírou chybovosti. Prosím, viz manuál BWA pro více informací.
Má BWA sladit 454 čte?
& Nbsp; Ano i ne. Komponenta BWA-SW z BWA funguje na 454 čte o 200bp nebo déle. Dosahuje podobné přesnosti zarovnání SSAHA2 zatímco mnohem rychleji. BWA-SW také pracuje pro kratší čte, ale citlivost je nižší. Kromě toho, BWA-SW nepodporuje spárován-end zarovnání.
Co je maximální délka sekvence dotaz v zákrytu?
& Nbsp; Doporučuje se používat pouze bwa-málo čte kratší než 200bp. I když Bwa-krátký prací až do několika kb dotazu v zásadě jeho výkon je degradován. Pro delší čte, BWA-SW je lepší.
& Nbsp; složka BWA-SW může zarovnat BAC sekvenci (asi 150kbp) proti lidského genomu. Rychlost, pokud jde o vyrovnaných bází za jednotku času, je srovnatelná s rychlostí 1kbp vyrovnání čtení. V zásadě, BWA-SW by měl být schopen sladit několik MBP sekvence dotazu stejnou rychlostí, ale já jsem se snažil.
Co je tolerance chyb sekvenčních?
& Nbsp; Bwa-krátký je určen především pro míry chyb sekvencování pod 2%. Přestože uživatelé mohou požádat ji tolerovat další chyby možnosti příkazového řádku tuning, jeho výkon je rychle degradován. Všimněte si, že pro Illumina čte, bwa-krátký může případně trim nekvalitní báze od 3'-konci před zarovnání a tím je schopen přizpůsobit více čte s vysokou mírou chyb v ocase, který je typický pro Illumina dat.
& Nbsp; BWA-SW toleruje více chyb uvedené déle vyrovnání. Simulace naznačují, že BWA-SW může pracovat dobře daný 2% chyba pro vyrovnávání 100 bp, 3% chybou pro 200bp, 5% pro 500 bp a 10% pro 1000bp nebo déle vyrovnání.
Má BWA najít chimérickými čte?
& Nbsp; Ano, složka BWA-SW je schopen nalézt chiméru. BWA obvykle hlásí jednu zarovnání každý číst, ale může být na výstupu dva nebo více vyrovnání v případě, že čtení / contig je chiméra.
Má BWA volání SNP jako Maq?
& Nbsp; Ne, BWA dělá jen vyrovnání. Nicméně, to výstupy zarovnání ve formátu SAM, který je podporován několika obecně SNP volajících, jako jsou samtools a GATK.
vidím jedno čtení ve dvojici má vysokou kvalitu mapování, ale druhá čtení má nulu. Je to pravda?
& Nbsp; Toto je správná. Kvalita Mapování je určen pro individuální čtení, ne za pár čtení. Je možné, že jeden čtení mohou být mapovány jednoznačně, ale jeho kolega spadá do tandom opakování a tím i její přesná poloha není možné určit.
Vidím čtení vyniká konec chromozomu a je označen jako nenamapované (vlajky 0x4). To, co se tady děje?
& Nbsp; Vnitřně BWA zřetězuje všechny referenční sekvence do jedné dlouhé sekvence. Čtení mohou být mapovány na spojnici dvou sousedních referenční sekvence. V tomto případě, BWA bude vlajka číst jako unmapped, ale uvidíte pozici, doutníků a všech značek. Lepším řešením by bylo zvolit jinou polohu, nebo oříznout vyrovnání z konce, ale je to docela složité programování a není prováděna na chvíli.
Má BWA práci na referenční sekvence delší než 4 GB celkem?
& Nbsp; Ne, to není možné, a nebudou podporovány v blízké budoucnosti v důsledku technické složitosti problému.
Errata strong>
Přípona pole Interval prázdný řetězec by měl [0, n-1], kde n je délka databáze řetězce, ne [1, n-1], jak je uvedeno v Li a Durbin (2009 a 2010). Obdobně, musíme definovat O (-1) = 0 a revidovat pseudocode na obrázku 3 z Li a Durbin (2009). Implementace BWA je vlastně správné. Chyba se vyskytuje pouze na papír. Omlouváme se za zmatek a děkuji Nils Homer a Abel Antonio Carrion Collado na to poukázat
Co je nového v této verzi:.
- Oprava chyby:. duplikovány alternativní hity v tagu XA
- Oprava chyby: při ořezávání povoleno, BWA-aln kryty 1bp méně .
- Disabled zarovnání barevného prostoru. 0.6.x nepracuje s pevnými čte v současnosti.
- Oprava chyby:. Segfault kvůli nadměrnému nejednoznačné základen
- Oprava chyby:. Nesprávná poloha kolega v režimu SE
- Oprava chyby: vzácné segfault v režimu PE
- Při makro _NO_SSE2 je v provozu, klesnout zpět na standardní Smith-Waterman
- místo SSE2-SW.
- Případně označit rozkol hity s nižším skóre zarovnání jako sekundární.
- Oprava chyby:. Nekonečné smyčky způsobené dvojznačný bází
- Případně výstupní sekvence dotazu.
Komentáře nebyl nalezen