Lucene, il potente motore di ricerca java installato su eZ publish.

eZ publish, è un gran CMS, ma come tutte i software ha anche i suoi punti di debolezza, il motore di ricerca. Allo stato dell’arte il motore di default installato su eZ publish supporta solo query full text in AND, cioè è in grado di cercare solo oggetti dove sono presenti tutte le parole che l’utente vuole cercare. Questa è una grande limitazione, per tanto, ho deciso di provare l’estensione Lucene che sostituisce il motore standard di eZ cone Apache Lucene:

Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, especially cross-platform.

L’installazione è stata piuttosto semplice, anche se è richiesto il controllo completo sul server, in quanto bisogna ricompilare il pacchetto php-java-bridge. Tutte le informazioni per l’installazione si trovano all’interno dell’estensione leggendo il file README.

Una volta configurato il tutto (installato jvm sul server ed installato il php-java-bridge) basta attivare l’estensione, svuotare la cache e il tutto è operativo.

Ora si possono effettuare ricerche in AND, OR, con wildcard e con caratteri speciali.

Veramente un gran bel lavoro e molto bello anche la percentuale di score presente nei risultati che rappresenta la vicinanza all’obiettivo cercato.

Il motore è in grado di indicizzare tutti documenti collegati al CMS, pagine web, pdf, multimediali, doc e molti altri

3 Commenti:

  1. kOoLiNuS, 23. luglio 2007, 17:02

    a livello di diffusione di questi strumenti non vedi il requisito del “possesso” totale del server per eZ o questa “estensione” come una limitazione ?

    si, lo so, la virtualizzazione prende piede, eppero’ …

     
  2. Ciccio, 24. luglio 2007, 23:30

    Ritengo che un motore di ricerca del genere occorra a siti di classe enterprise. Un progetto di questo tipo non è pensabile metterno in uno sharing hosting non solo per le performance ma anche per la garanzia, i backup, la ridondanza…quindi non lo vedo come un limite, ma come un normale compromesso per avere servizi di alto livello.

     
  3. fullo, 25. luglio 2007, 20:14

    e provare il porting di lucene scritto per lo Zend Framework? così da non dover passare da java e ricompilazioni di pacchetti strane…

     

Lascia un commento: