Whoosh

Whoosh

Whoosh je knihovna tříd a funkcí pro indexování textu a poté prohledávání indexu.Umožňuje vám vyvinout vlastní vyhledávací nástroje pro váš obsah.
Whoosh je rychlá, funkční fulltextová knihovna pro indexování a prohledávání implementovaná v čistě Pythonu.Programátoři jej mohou použít pro snadné přidání vyhledávacích funkcí do svých aplikací a webových stránek.Každá část práce Whoosh lze rozšířit nebo nahradit přesně podle vašich potřeb.Některé z funkcí Whoosh patří: Pythonic API.Pure-Python.Není třeba kompilace ani binární balíčky, žádné záhadné pády.Polní indexování a vyhledávání.Rychlé indexování a vyhledávání - rychlejší než jakékoli jiné čisté vyhledávací řešení, které znám.Viz Benchmarks.Zásuvný skórovací algoritmus (včetně BM25F), analýza textu, úložiště, formát účtování atd. Výkonný dotazovací jazyk.Čistá kontrola pravopisu Python v kvalitě produkce (pokud vím, jediný).... Whoosh může být užitečný za následujících okolností: Kdekoli je třeba použít řešení čistého Pythonu, aby se nemuselo budovat / kompilovat nativní knihovny (nebo nutit uživatele, aby je stavěli / kompilovali).Jako výzkumná platforma (přinejmenším pro programátory, pro které je Python snadnější číst a pracovat s nimi než Java;) Když je pro vás důležitější snadno použitelné rozhraní Pythonic než hrubá rychlost.Pokud vaše aplikace může dobře využít jedno z hluboce integrovaných řešení vyhledávání / vyhledávání, můžete se spolehnout na to, že tam budete, spíše než na dvě různá vyhledávací řešení (jednoduchá / pomalá / domácí integrovaná, indexovaná / rychlá / externí binární závislost jakovolba).Whoosh byl vytvořen a je udržován Mattem Chaputem.Původně byl vytvořen pro použití v online systému nápovědy 3D animačního softwaru Side Effects Software Houdini.Side Effects Software Inc. laskavě souhlasil s otevřeným zdrojovým kódem.
whoosh

Alternativy k Whoosh pro Java s licencí open source