NCBI C ++ Toolkit nabízí bezplatné, přenosné, veřejné knihovny domén bez omezení používat. Funguje na Unix, MS Windows a Mac OS platformy:
ย ท sítí a komunikace mezi (IPC), knihovna s iostream adaptéry
ย ท multithreading Library
ย ท CGI a Fast-CGI Library
ย ท HTML Library Generation
ย ท SQL databáze Access Library
ย ท C ++ wrapper knihovna pro BerkeleyDB
ย ท C ++ iostream adaptér / Wrapper Library
ย ท GZIP a BZ2 C ++ wrapper knihovna s iostream adaptéry
ย ท ASN.1 a XML serializace knihovna s C ++ generátor kódu Tool (datatool)
ย ท Datum a čas knihovna
ย ท File System knihovny funkcí
ย ท argument příkazového řádku, konfigurace a životní prostředí Processing Library
ย ท Sequence Alignment Algoritmy Library
ย ท Library BLAST Engine
ย ท biologických sekvencí získávání a zpracování knihovna
ย ท Portable FLTK a OpenGL GUI a grafické knihovny
Kromě výše, existuje mnohem více užitečných knihoven, a to jak pro všeobecné použití a biotechnologické účely, jež se neustále vyvíjí, udržovány a používány při výrobě real-život stovkami webu a samostatných aplikací a jejich programátory (také počítá ve stovkách).
Jste-li C ++ developer najdete přenosný charakter knihoven velmi užitečné při budování cross-platformní aplikace, i když nemáte velký zájem bioinformatiky. Knihovny, jako jsou ty, pro CGI / Fast-CGI, HTML, sítí, SQL databáze Access, ASN.1 a XML serializace jsou poměrně obecné účelu a mohou být použity v různých aplikacích mimo problémové domény Bioinformatika.
C ++ Toolkit prochází aktivní vývoj s knihovnami staví každou noc. Zdrojový kód je volně k dispozici prostřednictvím FTP a CVS. Dokumentace pro C ++ Toolkit je k dispozici on-line ve formátu NCBI Bookshelf a také jako ke stažení knihy ve formátu PDF Acrobatu
Co je nového v této verzi:.
< p>- UDÁLOSTI:
- Added LDS2 (Local Data Storage v.2), který je založen na sqlite3, má nové funkce a lepší výkon. Také realizován Data Loader LDS2 použít LDS2 z Object Manager.
- XmlWrapp -to pohodlnější manipulaci s XML API bylo většinou skončil (a dokonce i leštěné).
- Realizace tunelování a povolení připojení HTTP a tunelování Secure Sockets, přes HTTP proxy.
- CFormatGuess nyní umožňuje rozlišovat mezi GTF, GFF3 a GFF2. Je to možná lámání změna. Pro více informací viz níže.
- Realizované hlavní části CFeatTree, třída organizovat funkce definované na biologický sekvence do hierarchie, která odráží jejich rodič-dítě vztahy (na základě funkce subtypy).
- CORELIB:
- Realizované locale nezávislá konverze řetězce na dvojnásobek a zpět; změněné základní knihovny ji používat.
- NStr :: bloku () - pro formátování odstavců textu .
- CNcbiApplication - jak FindProgramExecutablePath statické, a robustnější; přidat statickou metodu GetAppName na vyšší úrovni. Podívejte se na globální konfigurační soubory ve více případech.
- CMetaRegistry :: FindRegistry. - Nový způsob vystavení logiku určující, který soubor (pokud existuje) k načtení
- CEnvironmentCleaner. - Nová třída se zbavit nechtěných proměnné prostředí
- CFileIO - zpět na původní chování:. Nezavírejte popisovač souboru, pokud je to přiděleno přes SetFileHandle ()
- Seriál:
- Serializace AnyContent datových objektů - pevné rozpoznat a správně proces atributy jejich hodnoty .
- Opraveno čtení dat XML přiřadit implicitní hodnotu prvku, když to nemá žádný obsah.
- Přidána podpora pro sekvence prvků, kde je prvek má výchozí hodnotu.
- DATATOOL:
- Opraven kód generace:
- CHOICE objekty dat;
- binární datové typy s atributy.
- Opravený převod hodnot typu double zachovat více platných číslic.
- CONNECT:
- Přidána keepalive socket možnost (fSOCK_KeepAlive).
- Added NCBI Test připojení (CConnTest).
- Utility:
- g_FindDataFile. - Nová funkce pro umístění datových souborů (konfigurovatelné) standardní umístění
- CChecksumStreamWriter. - Nová třída pro výpočet kontrolního součtu písemných do proudu dat
- g_GZip_ScanForChunks () - nové API, na dotaz stlačený potok pozic. Přidána implementace pro získání pozice samostatných gzip soubory uvnitř zřetězeném gzip souboru.
- Přidáno komprese / dekomprese potok manipulátorů (include / util / kompresi / stream_util.hpp).
- CFormatGuess (util / format_guess. {H / c} pp) Aktualizován případně zlomit změnu. Účelem je, aby CFormatGuess rozlišovat mezi GTF, GFF3 a GFF2. V současné době boule všechny tyto formáty do jednoho "eGtf" hodnoty. Hodnota staré "eGtf" (3) je nahrazen "eGtf_POISONED", a nebudou znovu vrátit. Nová hodnota "eGtf" (21), bude znamenat soubor, který je třeba si přečíst s CGtfReader (objtools / čtenáři / gtf_reader.hpp). Nová hodnota "eGff3" (22) je pro soubory, chtěl číst s CGff3Reader (objtools / čtenáři / gff3_reader.hpp), a "eGff2" (24) je pro soubory chtěl číst s CGff2Reader (include / objtools / čtenářů /gff2_reader.hpp)
- BIO objekty:
- CBioseq :: GetNonLocalId - Nová metoda pomoci place sekvencí dovezené z Fasta souborů se specifikacemi rozsahu ve více souvislostech; obalené CBioseq_Handle :: GetNonLocalIdOrNull (rovněž nový).
- CSeq_id :: IdentifyAccession - Provádět nebo zlepšit uznávání pro více prefixů (GA, HH, HI, HO-hu, JA-JO, EAAA-EZZZ, a IAA-Izz, z nichž některé odpovídají nové možnosti DDBJ TPA WGS data) a smíšené, v TPA protein přístupech (většinou z EMBL, ale někteří z GenBank příliš).
- Rozlišujte WGS mistrovských přistoupení; novou vlajky bit. Relax Příliš přísná PNR logiku uznání.
- CSeq_id :: IsValidLocalID, CSeq_id :: ParseIDs -. Nové funkce pro práci s plain-text sekvence identifikátorů, vytknout z CFastaReader a generalizované poněkud
- SSeqIdRange - Nový typ (kompletní s analyzátorem a on-the-fly & quot; iterator & quot;), pro práci s Sekvenční-id rozsahy, jak je přítomný v některých zdrojových FASTA defline modifikátory .
- BIO-TOOLS:
- CFastaOstream - Volitelně přijmout vlastní názvy pro jednotlivé sekvence. Štítek negativní pramenů se pohybuje s předními "c letech.
- CFastaReader - Podpora negativní pramenů rozsahy a mezery syntaxe kompaktní defline stylu flitry se (? & Quot; & gt; N & quot; kde N je číslo, nebo & quot; & gt; unk100 & quot;)
- COBALT:
- Přidána možnost příkazového řádku -num_domain_hits že omezuje počet konzervovaných domén na pořadí používané při výpočtu omezení zarovnání.
- fylogenetických stromů:
- vyšší přidanou rozhraní úrovně pro výpočet fylogenetický strom z sekvenčních zarovnání (například výbuch a výsledky kobalt). Class CPhyTreeCalc počítá fylogenetický strom, a CPhyTreeFormater vytiskne strom Newick a Nexus formátu.
- BIO-objektových knihoven:
- Realizované CheckNumRows () a další metody pro řídké zarovnání.
- Chcete-li snížit nároky na paměť: přidáno čtení háčky snížit paměť používaná zarovnání po deserializace; Na-strand nyní používá jeden bajt paměti, kde je to možné; Score.value volba je nyní zakotven v CScore.
- Vydělat přistoupení v CSeq_id :: GetLabel ().
- BIO-Object Manager:
- Přidány getrové metody logická pole v CTableFieldHandle.
- Added GetBestGeneForFeat () na základě CFeatTree.
- Realizovaný GetBestOverlappingFeat () na CFeatTree.
- přidáno rychle cscope :: GetTaxid ().
- Realizováno bulk zatížení pro ACC / ver, gi, štítek, a taxid.
- Přidané mezery nulovou délkou zkontrolujte CSeqMap a CSeqVector.
- Realizovaný GetLength () a GetCoverage () pro dluhopisy míst.
- Zlepšení:
- Přidal metoda pomocník vyplnit CFeatTree na místě.
- zrychlil mapování jednoduchých CSeq_loc_mix míst v CFeat_CI.
- Přísnější třídění funkcí v CFeat_CI aby nedocházelo k nejasnostem.
- CSeq_feat_Handle getrů nyní pracují se SEK stůl je k dispozici také.
- vlastnosti Sekvenční stoly nyní podporují pole uživatelské multi-level.
- Non Sekvenční-feat Seq stoly jsou nyní uznávané, i když se nachází v rozděleném bloku.
- zrychlil CBioseq_Handle :: AddId ().
- Optimalizováno cscope :: AttachXxx ().
- Podpora split s názvem anotace.
- CSeqVector a CSeqVector_CI je CanGetRange () nyní vrací false místo vyvolání výjimky.
- Povolit určit, jak se vypořádat se stávajícími madly v ResetHistory ().
- Optimalizováno re-rodičovství, pokud jsou přidány další funkce, které CFeatTree.
- Přidána možnost ladění cscope vytvoření / smazání.
- Mnoho změn C ++ vyčištění funkce napodobit funkci vyčištění, které již v C. existuje Tam je ještě stále co dělat s BasicCleanup, ale bylo dosaženo významného pokroku. Málo práce byla provedena pro ExtendedCleanup jak přesto.
- CSeq_loc_Mapper lze nyní inicializovat pomocí GC-shromáždění.
- Opravy chyb:
- Pevná mapování mix míst na minus oblast v CFeat_CI.
- Mnoho oprav v cestě CFeatTree spojuje vlastnosti.
- několik závitů bezpečnostní opravy.
- Pevná překlep zabránit přidávání zarovná a grafů CSeq_annot_EditHandle.
- Safeguard proti výjimky při řazení funkcí CFeat_CI.
- GENBANK Data Loader:
- Registered HPRD externí poznámky.
- Přidáno volitelný exclude_wgs_master param v pubseqos / pubseqos2 čtenářů.
- Realizováno bulk zatížení pro ACC / ver, gi, štítek, a taxid.
- Added CGBDataLoader :: CloseCache ().
- Využití:
- Použití hromadné načítání žádosti v cscope :: GetBioseqHandles ().
- Oddělená statistika čtenář podle typu zatížených puntíky.
- Přidal timestamp ladění zprávy GenBank.
- Použít IConnValidator pro otevírání PubSeqOS připojení.
- Přidáno split-verze žádostí bloku a kus podklíče v GenBank mezipaměti se zabránilo používání nesprávné kusy, když blob dělená stav se změní v ID.
- Přidáno sekundární méně matoucí názvy param upřímné časového limitu.
- nemnoží počet opakování podle počtu připojení.
- Object Manager test a ukázkových aplikací:
- id2_fetch_simple. - Přidán -id možnosti pro libovolné Seq-id
- test_bulkinfo. - Nový testovací aplikace
- FASTA:
- funkce funkce tabulka C ++ byly více funkční, jako pro část BankIt projektu.
- asn2flat nástroj
- obrovské množství změn flatfile formátovací, aby byl mnohem blíže k uvolnění-ready stavu (případně uvolnit připraveno v tomto bodě, i když některé relativně drobné problémy i nadále).
- XMLWRAPP:
- Pevná chyba segmentace v případě přijetí odkaz na výraz XPath běží výsledky.
- Přidal pomocníky, aby si veřejnost ID, ID systému a název DTD pro vnější a vnitřní podskupin.
- Přidáno metody vyhledávání atributy uzlu.
- Pevné provedení výrazu XPath:. Nyní vychází z daného uzlu
- Pevná vyhledávání atributy (včetně výchozí), když je jmenný prostor k dispozici.
- Přidána možnost spustit výraz XPath bez nutnosti registrace jmenných prostorů explicitně.
- Přidána možnost zajistit kontejnery pro sběr chyby a varování při analýze dokumentů.
- Přidána možnost měnit hodnoty a jmenné prostory na výchozí atributy uzlu.
- Přidána možnost otestovat, zda atribut je výchozí nastavení.
- Přidána možnost vložit nebo odstranit atributy a zároveň s ohledem na jejich jmenných prostorů.
- Přidána možnost, aby se svlékli deklarace XML, kdy je dokument uložen.
- WindowMasker:
- Přidán nový vstupní formát, & quot; & quot ;; seqids V tomto vstupním formátem, vstup je soubor, který obsahuje pořadové číslo na každém řádku, a algoritmus používá Správce Bio-Object podívat do sekvence.
- Přidány nové třídy CWinMaskConfig, pro ukládání všech konfiguračních parametrů WindowMasker. Třída může být použit pro přidání potřebné argumenty příkazového řádku k CArgDescriptions, a pak se konfiguračních parametrů z příkazového řádku argumenty.
- BUILD RÁMEC (UNIX):
- Interpretace specifikace příkazového řádku APP_PROJ nebo LIB_PROJ jako narážka na vyklidit další * nastavení _PROJ tam není také k dispozici. (Vyžaduje GNU Udělat;. Staví se společností Sun dělají i nadále pracovat jako dříve)
- Supply další objekty v podadresářích:. * _F (S využitím místních plochých makefiles vyrobené na zakázku, bez závislostí na jiných částech stromu), * _fd (balící nejvyšší úrovně Makefile.flat), clean_sources a purge_sources
- Konfigurace a jeho pohodlí skripty (kompilátory / unix / * sh.):
- Za zmínku stojí nová vlajka --without-3psw. - Nelze použít s jakýmkoli software 3. stran
- Přidána šek na Glew.
- Lepší kontroluje Boost, a OpenGL.
- Podpora uvedením běh cesty na Darwin (Mac), systémy s moderními toolchains.
- BLAST:
- V Darwin (Mac OS X), stavět pouze pro procesory Intel i v jinak univerzální staví kvůli omezení PowerPC toolchain.
- Byla přidána podpora pro získávání NCBI Taxonomy ID, pro které je k dispozici podpora WindowMasker.
- Povolit specifikaci sekvence dotazu spolu s více souborových sekvenčního v psiblast.
- Přidána databáze hard-maskování support.
- Přidána databáze soft-maskování vícejazyčné vyhledávání.
- Byla přidána podpora pro btop (BLAST neexistuje mechanismus dohledávání operace) a dotaz a délka předmětu v tabulce zprávě.
- příkazového řádku aplikace - umožňují psiblast vyhledávat více dotazů, přidal volitelný -input_type pro makeblastdb
- Povolit použití nejlepších hit a XML v režimu blast2sequences.
- Lepší formátování výkon pro vzdálené vyhledávání.
- makembindex nyní postavit maskovaný index Megablast přímo z BLAST nukleotidů databázi pomocí maskovací informace uložené v databázi výbuchu. Toho je dosaženo novou možnost příkazového řádku -db_mask na makembindex. Volba přijímá celé číslo id filtračního algoritmu podporované databáze BLAST. Tuto možnost lze použít pouze ve spojení s -iformat blastdb.
- Chcete-li pomoci uživateli při hledání z číselných IDS filtračních algoritmů podporovaných databáze BLAST je zavedena vlajka -show_filters. Použití vlajku s -iformat blastdb a výbuch databáze, vstup způsobí makembindex výstup seznam dostupných filtrování algoritmů a východu.
- Aplikace NetCache:
- NetCache je přepracovaný obsahovat následující funkce:
- lepší řízení na disku;
- lock-méně práce s puntíky, verzování se používá místo;
- multi-portové poslech a za klientem nastavení odlišení.
- NetCache a ICache API:
- Použít uint8 všude velikost blob.
- Povolit částečné vyhledávání blob.
- Zavedena ochrana blob heslem; prázdná hesla jsou považovány za žádné heslo.
- Pracovní uzel APIs:
- Nový parametr pro ukončení uzlu pracovníků, pokud je jeho spotřeba paměti překročí stanovený limit (parametr & quot; total_memory_limit & quot;) .
- Nový parametr pro ukončení uzlu pracovníků, pokud jeho běhu překročí stanovený limit (parametr & quot; total_time_limit & quot;) .
- GRID APLIKACE:
- netscheduled
- Opravena chyba, která způsobila žádnou odpověď na příkaz vymazání fronty.
- remote_app
- Nový konfigurační parametr (& quot; tmp_dir & quot;), kontrolovat, jak je dočasná generován název adresáře - snížit délku
- Přihlaste se blob chybě při zápisu.
- netcache_control
- Povolit částečné vyhledávání blob.
- Nový příkaz -remove odstranit kuličky podle jejich ID.
- Nový parametr -auth zadat ověřovací řetězec k použití.
- Nové příkazy -reconf a -reinit pro administrátory NetCache.
- netschedule_control
- Povoleno režim kompatibility, aby netschedule_control práce se staršími pracovníků uzly.
- cgi2rcgi.cgi
- Nevytvářejte prázdný NetCache blob jako zástupný symbol pro zprávu o pokroku.
- chyby Přihlásit Grid, které jsou hlášeny k uživateli.
- Povolit mezery v parametru ID úlohy.
- Podpora výstup informace o stavu úlohy ve formátu JSON.
- Povolit vlastní šablony HTML být definovány pro GRID chyby a další akce.
- přidán žádný-cache HTTP hlavičky, aby se zabránilo ukládání do mezipaměti průběžných výsledků.
- ncfetch.cgi
- Nový parametr pro přístup kuličky chráněné heslem.
- Interpret další parametr & quot; název & quot; jako název souboru staženého souboru.
.
Co je nového ve verzi 31 prosince 2008:
- Tato verze přidává metodu počítat sloupec specifické pseudocounts v PSI-Blast.
- Je refactors knihovnu mřížky služeb.
- Dodává unit testy rámec a protokolování chyb pro všechny třídy File API.
- Stanoví pthread podporu na IRIX. To zvyšuje podporu XML serializaci.
- Opravuje podporu pro Sybase.
- Je přidává podporu pro malé vyhledávací tabulky pro malé dotazů.
- Dodává API pro získání GenBank statistiky nakladače.
- Je nejrůznějších dalších vylepšení, speedups a oprav.
Komentáře nebyl nalezen