SHOGUN je open source software projekt navržený od offset poskytnout strojového učení sadu nástrojů zaměřené na způsoby jádra velkých, a speciálně navržený pro podporu Vector Machines (SVM). Tento software lze snadno použít v rámci různých programovacích jazyků, včetně C, C ++, Python, Octave, Matlab, Java, C #, Ruby, Lua, UNIX Shell a R.
Aplikace nabízí standardní SVM (Support Vector Machines), objekt, který může komunikovat s různými SVM implementací. To také zahrnuje mnoho lineární metody, jako je například lineární programování Machine (LPM), lineární diskriminační analýza (LDA), (jádra) Perceptrons, stejně jako některé algoritmy, které mohou být použity k vlaku skryté Markov models.Features na několika glanceKey funkce patří jeden klasifikace třídy, multiclass klasifikace, regrese, strukturovaný výstup učení, pre-zpracování, vestavěné modelové strategie výběru, rámec testování, rozsáhlou podporu učení, více věcí najednou, učení, adaptace doména, serializace, paralelizovat kód, měřítka výkonnosti, jádro hřebenová regrese, vektor regrese podporu a Gaussian procesy.
Kromě toho, že podporuje více učení jádra, včetně q-normy MKL a multiclass MKL, podporuje naivní Bayes, logistická regrese, LASSO, k-NN a Gaussian procesu klasifikace classifiers, podporuje lineární programování strojů, LDA, Markov řetězy, skryté Markovovy modely, PCA, kernel PCA, Isomap, vícerozměrné škálování, lokálně lineární vkládání, šíření mapa, lokální zarovnání tangent prostor, stejně jako laplacián eigenmaps.
Dále je vybaven Barnes-Hut t-Národní odborník podporu, jádra Normalizer esovitou jádro, jádra řetězce, polynom, lineární a Gaussova jádra, hierarchického shlukování, k-means, optimalizace BFGS, gradient klesání, vazby na CPLEX, vazby na Mosek, štítek sekvence učení, faktor graf učení, SO-SGD, latentní SO-SVM a řídké údaje representation.Under kapotu a availabilitySHOGUN je hrdě napsáno v Pythonu a C ++ programovacích jazyků, což znamená, že si rsquo; s kompatibilní s libovolným operačním systémem GNU / Linux tam, kde existují Python a GCC. Je k dispozici ke stažení jako univerzální archivu zdroj, takže si můžete nainstalovat na libovolný jádra na bázi operačního systému Linux
Co je nového v této verzi:.
- Vlastnosti:
- Plně podporuje python3 teď
- Přidat mini-batch k-means [Parijat Mazumdar]
- Přidat k-means ++ [Parijat Mazumdar]
- Přidat sub-sekvence string kernel [lambday]
- Opravy chyb:
- sestavit opravy pro nadcházející swig3.0
- Zrychlení na Gaussova proces "platit ()
- Zlepšit jednotka / integrační test kontroluje
- libbmrm neinicializovaný paměť čte
- libocas neinicializovanou paměti čte
- Octave 3,8 sestavit opravy [Orion Poplawski]
- error Fix java modulární kompilace [Bjoern Esser]
Co je nového ve verzi 3.1.1:
- Fix Chyba kompilace vyskytují CXX0X
- Bump verze dat na požadovanou verzi
Co je nového ve verzi 3.1.0:
- Tato verze obsahuje převážně opravy chyb, ale také funkce vylepšení .
- nejdůležitější, několik úniků paměti v souvislosti s uplatnit () byly opraveny.
- Psaní a čtení Shogun funkcí, jak protobuf objektů je nyní možné.
- vlastní jádro Matice mohou nyní být 2 ^ 31-1 * 2 ^ 31-1 ve velikosti.
- Multiclass ipython notebooky a ostatní zlepšily.
- Leave-one-out crossvalidation je nyní pohodlně podporován.
Byly přidány
Co je nového ve verzi 2.0.0:
- Obsahuje vše, co bylo provedeno před a během Google Summer of Code 2012.
- Studenti zavedly různé nové funkce, jako je strukturované výstupu učení, Gaussova procesů latentní proměnné SVM (a strukturovaného výstup učení), statistické testy v jaderných množících prostorech, různých věcí najednou algoritmů a různá vylepšení použitelnosti, abychom jmenovali alespoň některé.
Co je nového ve verzi 1.1.0:
- Tato verze zavedl pojem "měničů", který umožňuje postavit embeddings libovolných funkcí.
- Obsahuje také několik nových technik snižování rozměru a významné zlepšení výkonu v toolkitu snížení počtu rozměrů.
- Další vylepšení zahrnují významnou kompilace urychlit, různé opravy chyb pro modulární rozhraní a algoritmy, a zlepšení Cygwin, Mac OS X a řinčení ++ kompatibilitu.
- Github Problémy se nyní používá pro sledování chyb a problémů.
Co je nového ve verzi 1.0.0:
- Tato verze je k dispozici rozhraní pro nové jazyky, včetně Java, C #, Ruby, a Lua, rámec výběr modelu, mnoho technik snižování rozměru, Gaussian odhad směsi model, a plnohodnotné on-line rámec vzdělávání.
Co je nového ve verzi 0.10.0:
- Vlastnosti:
- serializace objektů, které vyplývají z CSGObject, tedy všechny Shogun objekty (SVM, Kernel, Rysy, Preprocesory, ...) jako ASCII, JSON, XML a HDF5
- Vytvořit SVMLightOneClass
- Přidat CustomDistance obdobně jako vlastní jádro
- Přidat HistogramIntersectionKernel (díky Koen van de Sande pro patch)
- Podpora Matlab 2010a
- modulární podpora SpectrumMismatchRBFKernel (díky Rob Patro pro patch)
- Přidat ZeroMeanCenterKernelNormalizer (díky Gorden Jemwa pro patch)
- Doušek podpora 2,0
- Opravy chyb:
- Custom jádra může být nyní & gt; 4G (díky Koen van de Sande pro patch)
- Set C locale při startu v init_shogun, aby se zabránilo incompatiblies s ASCII plováky a fprintf
- Kompilace opravu, pokud je počítání referencí zakázán
- Oprava set_position_weights WD jádra (hlášené Dave duVerle)
- Oprava set_wd_weights WD jádra.
- Fix crasher v SVMOcas (hlášeno Jaroslava)
- Vyčištění a API Změny:
- přejmenováno SVM_light / SVR_light na SVMLight atd.
- Odstranit C předponu před non-serializovatelný názvy tříd
- Drop CSimpleKernel a zavést CDotKernel jako jeho základní třídy. Je potřeba Tímto způsobem jsou všechny jádra na bázi dot-produkt lze aplikovat na vrcholu DotFeatures a pouze jediné implementaci takových jader.
Co je nového ve verzi 0.9.3:
- Vlastnosti:
- Experimentální lp kód MCMKL
- Nové jádra: SpectrumRBFKernelRBF, SpectrumMismatchRBFKernel, WeightedDegreeRBFKernel
- WDK kernel podporuje aminokyseliny
- Smyčcové Charakter nyní podporují připojit operace (a tvorba
- Podpora python-dbg
- Povolit plave jako vstup pro vlastní jádro (matic a & gt; velikost 4 GB)
- Opravy chyb:
- Statické propojení fix.
- Fix add_to_normal rozptýlené lineární jádrem
- Vyčištění a API Změny:
- Odstranit init () funkce v měření výkonnosti,
- Nastavení .so přípony pro Python a používat Python distutils přijít na to, nainstalovat cesty
Co je nového ve verzi 0.9.2:
- Vlastnosti:
- Direct čtení a psaní ASCII / binárních souborů / HDF5 soubory založené.
- Realizace multi normalizer kernel úkol.
- Implementace SNP jádro.
- Zavést lhůtu pro libsvm / libsvr.
- Integrace Elastic Net MKL (díky Ryoata Tomioka pro patch).
- Implementace hodnotu hash WD funkce.
- Implementace hashed Řídký Poly funkce.
- Integrace liblinear 1,51
- LibSVM lze nyní trénoval s zaujatost vypnutou.
- Přidat funkce do získání / globální a lokální IO / paralelní / ... objektů.
- Opravy chyb:
- Fix set_w () pro lineární klasifikátory.
- Statické Octave, Python, cmdline a Modular Python rozhraní Kompilace čistě pod Windows / Cygwin znovu.
- V statických rozhraní Testování může selhat, pokud ne přímo dělat po tréninku.
Komentáře nebyl nalezen