Podrobnosti Software:
Sherlock Holmes je univerzální vyhledávač, systém pro sběr a indexování textových dat (textové soubory, webové stránky, atd), jak lokálně, tak i na síti.
Vlastnosti :.
- Shromažďuje souborů přes HTTP nebo z místních souborů
- Analyzuje textové soubory, HTML, PDF, a několik dalších formátů pomocí externí analyzátory (například MS Word a PostScript).
- Celý systém je modulární, takže přidáním vlastních zdrojů údajů nebo analyzátory je jen otázka zapojíte pravého modulu (dobře, obvykle také psaní).
- Funguje dobře ve smíšeném charset prostředí.
- domnívá se více výskytů stejného souboru (dokonce s malými změnami) do jednoho dokumentu s více URL.
- Vše, co je vysoce konfigurovatelný. Můžete psát pravidla filtrování ve speciálním jazyce, který umožňuje vyladit proměnné konfigurace v závislosti na dokument se zpracovává.
- Vyhledávání slov, frází a boolean výrazů. Hledání v názvech souborů a odkaz texty.
- Hledání Proximity a blízkost váhu běžné vyhledávání.
- Rozpoznávání jazyků, snadná integrace lemmatizátory a synonymických slovníků.
- Kontrola pravopisu na základě slovních frekvencí pozorovaných v indexovaných datech, naznačuje uživateli, že jeho dotaz by mohly být chybně napsané.
- Výsledky vyhledávání zahrnují kontext v každém dokumentu.
- Váhy dobře desítek milionů dokumentů na normální PC hardwaru.
- Uživatelské rozhraní (front-end), je zcela oddělen od zbytku systému, takže je snadné upravit, a také vložit vyhledávač na stávajících aplikacích.
- stažené soubory a indexy jsou komprimovány, aby se ušetřilo místo.
Komentáře nebyl nalezen