Apache Tika 1.4

Apache Tika je open source nástrojů určen k detekci a extrahovat metadata, stejně jako strukturovaný textový obsah z několika dokumentů, pomocí nic, ale existující parser knihovny.Apache Tika podporuje následující formáty dokumentů: HyperText Markup...