Apache prase plodil od Apache Hadoop projektu a je jedním z jeho modulů, že tam, kde na starosti poskytování způsob, jak analyzovat data, která zpracovány a uloženy.
Pig používá jazyk, vlastní dotaz s názvem "prasečí latina", který je neuvěřitelně snadno učí a podporuje jak relační a funkční styly.
To znamená, že můžete použít jako klasický jazyk SQL těžit z dat spojení a filtrů, nebo můžete použít jeho MapReduce funkce, datové mapovače a redukce.
Ve výchozím nastavení měla Apache prase, které mají být použity uvnitř Hadoop instalacích, ale novější verze povolit jeho spuštění odděleně pomocí samostatného JVM
Co je nového v této verzi:.
- Zásuvné Execution motory (aby prasat útoku na non-MapReduce motorů v budoucnu)
- Režim Auto-local (k pracovním místům s malou velikostí vstupních dat spustit v procesu)
- Načíst optimalizace (zlepšit interactiveness z grunt)
- Pevné stojany lokálním režimu
- Podpora pro uživatelské úrovni jar paměti cache
- Podpora na černé listiny a Whitelist příkazy prasat
- Některé opravy výkonu a debuggability funkce
- modifikace non-zpětně kompatibilní rozhraní Několik byly zavedeny v této verzi, aby se prasečí práci s non-MapReduce motorů
Co je nového ve verzi 0.14.0:
- Zásuvné Execution motory (aby prase běží na non -mapreduce motory v budoucnu)
- Režim Auto-local (k pracovním místům s malou velikostí vstupních dat spustit v procesu)
- Načíst optimalizace (zlepšit interactiveness z grunt)
- Pevné stojany lokálním režimu
- Podpora pro uživatelské úrovni jar paměti cache
- Podpora na černé listiny a Whitelist příkazy prasat
- Některé opravy výkonu a debuggability funkce
- modifikace non-zpětně kompatibilní rozhraní Několik byly zavedeny v této verzi, aby se prasečí práci s non-MapReduce motorů
Co je nového v 0.11.0:
- Tato verze obsahuje DateType datový typ, hodnost, a CUBE Kumulativní operátory, Groovy UDF, vlastní odhad reduktor, n-tice schématu-based a HCatalog DDL integrace.
Co je nového ve verzi 0.9.1:.
- Tato verze pracuje s Hadoop 0,20
Co je nového ve verzi 0.6:
- Přidaný Zebra jako contrib projekt. Viz http://wiki.apache.org/pig/zebra
- Přidáno UDFContext, dává UDF způsob, jak předávat informace zepředu dozadu konec a dává UDFS přístup k JobConf v backend.
- Přidaný levé vnější spojení pro fragment replikou připojit.
- Přidána možnost nastavit prioritu úlohy z prasečí latině.
- Enhanced multi-query pro práci s spojení v některých případech.
- Přepracován správce paměti výrazně snížit GC režijní náklady a ven z poruch haldy.
- Přidána akumulátor rozhraní pro UDF.
- Více než 100 oprav a vylepšení.
Požadavky na
- Java 1.6.x nebo novější
- Apache Hadoop 0.20.x nebo novější
Komentáře nebyl nalezen