Big Data: a cosa serve ElasticSearch e come si evolve

ElasticSearch conquista i sei milioni di download e l'azienda sviluppatrice pensa al lancio di un prodotto commerciale basato sul tool

ElasticSearch si lancia alla conquista dei Big Data anche dal punto di vista commerciale. Infatti, la softwarehouse responsabile dello sviluppo del motore di ricerca open source, all’alba dei suoi 6 milioni di download presenta il primo prodotto commerciale correlato al tool ElastiSearch.

Marvel è il nome del pacchetto commerciale che consiste in una console di gestione e monitoraggio dei cluster ElastiSearch, pensata per aiutare gli utenti a lavorare in modo più semplice ed efficiente all’interno del mondo dei Big Data.Big Data: a cosa serve ElasticSearch e come si evolve

Per chi ancora non lo conoscesse, ElasticSearch è una tecnologia open source divenuta nel tempo molto popolare nell’ambito Big Data, negli ambienti enterprise e nel settore del cloud computing per l’incredibile capacità di ricercare, analizzare e mostrare dati contenuti nei documenti in formato JSON, con interrogazioni che avvengono quasi in tempo reale.

Il formato JSON (acronimo di JavaScript Object Notation) è un formato open standard che utilizza testo in linguaggio di alto livello comprensibile all’uomo per trasmettere oggetti di dati che consistano nell’accoppiata attributo-valore. All’inizio il formato JSON è stato utilizzato per trasmettere informazioni fra i server e le Web application, come alternativa al formato XML. In realtà, il formato JSON è indipendente dal linguaggio ed è per questo che viene implementato in una grande varietà di linguaggi di programmazione.

ElasticSearch è capace di lavorare con i documenti JSON e si propone come server di ricerca basato su Apache Lucene, una libreria open source per il recupero delle informazioni, le cui caratteristiche peculiari vengono rese disponibili da ElasticSearch agli utenti tramite formato JSON e API Java.

I motivi del successo di ElasticSearch

Il CTO di ElasticSearch, Shay Banon, spiega che il software è così popolare perché è utile e semplice. Parte dell’utilità è da ricercare, come si diceva, nell’abilità di analizzare in profondità i documenti JSON indipendentemente dalle informazioni contenute e senza necessità di costruire uno schema di interrogazione predefinito. In questo modo, ElasticSearch si rivela un importante complemento a soluzioni di data storage per i Big Data come MongoDB e Hadoop che in realtà non sono stati pensati per l’analisi dei dati o per svolgere in modo semplice e velocemente le query di interrogazione.

Il successo di questo tool open source è confermato anche dalla scelta che Facebook lo utilizza come strumento di analisi interna, mentre Wikipedia lo sfrutta per migliorare il motore di ricerca front-end destinato ai suoi utenti. Di recente, Wikimedia ha rimpiazzato lo storico lucene-search-2, basato su Apache Lucene, con ElasticSearch, preferendolo anche a Solr. Entro fine aprile, tutti gli utenti di Wikimedia potranno quindi usare il nuovo motore di ricerca con nuove funzionalità.

E questi sono solo alcuni degli esempi di implementazione: Rockstar ha usato ElasticSearch per analizzare i log di errore quando la versione online di Grand Theft Auto 5 ha avuto problemi, mentre il The Guardian utilizza lo strumento per analizzare i weblog verificando da dove giunga il traffico in tempo reale, in modo da offrire allo staff editoriale gli spunti per massimizzare la readership.

A questi si aggiungono Netflix, Atlassian e Github e l’azienda è convinta che alcuni di questi nomi possa anche decidere di diventare acquirenti di Marvel, che è gratuita per gli sviluppatori e poi ha un costo di 500 dollari in produzione per il mantenimento annuale di cinque nodi. Marvel consente agli utenti di vedere le performance di ElasticSearch in tempo reale e salva i dati storici per analisi predittive o individuazione delle anomalie di funzionamento.

Se Marvel dovesse avere successo, ElasticSearch continuerebbe la sua ascesa e l’azienda si trasformerebbe da una startup con 34 milioni di dollari di fondi provenienti da Index Ventures e Benchmark Capital in una software company sviluppatrice e venditrice di soluzioni di analisi di alto livello.