Il ‘crash’ di Europeana? Un fallimento da manuale

La fallimentare partenza di Europeana, la biblioteca digitale europea inaugurata Giovedi scorso dalla Commissione Europea e poi subito chiusa per eccesso di traffico, e dovuta ad alcuni errori davvero da manuale. Il sito (www.europeana.eu) contiene circa due milioni di opere d'arte di varia natura in formato digitale (libri, musica, dipinti, ecc.), tra cui la Divina Commedia, brani di Beethoven e Mozart, la Magna Charta, le immagini della caduta del muro di Berlino, ma anche manoscritti introvabili.

La fallimentare partenza di Europeana, la biblioteca digitale europea inaugurata Giovedì scorso dalla Commissione Europea e poi subito chiusa per eccesso di traffico, è dovuta ad alcuni errori davvero da manuale.

Il sito (www.europeana.eu) contiene circa due milioni di opere d’arte di varia natura in formato digitale (libri, musica, dipinti, ecc.), tra cui la Divina Commedia, brani di Beethoven e Mozart, la Magna Charta, le immagini della caduta del muro di Berlino, ma anche manoscritti introvabili.

L’obiettivo è di arrivare nel 2010 a un totale di dieci milioni di opere. Peccato però che per il momento il sito sia inaccessibile fino a data da destinarsi. “Gli accessi si sono rivelati tre volte superiori a quanto previsto, toccando vette di 10 milioni all’ora: siamo stati vittime del nostro stesso successo – ha detto Jon Purday, portavoce di Europeana -. Non è stato un crash, ma semplicemente il sito si è paralizzato, con ricerche che duravano minuti invece di secondi“.

Tuttavia una serie di interviste di IDG News Service a sviluppatori e addetti ai lavori coinvolti nel progetto rivela errori davvero classici, e problemi non indifferenti, tanto che ci vorranno altri 100mila euro, oltre al milione già investito dalla Commissione Europea, per far ripartire Europeana a metà dicembre in condizioni di efficienza.

Purday non ha fatto il nome del provider olandese che aveva in carico l’hosting del sito: “Stiamo lavorando con loro, si stanno impegnando giorno e notte da quando hanno scoperto la vastità del problema“. Tuttavia il portavoce ha evidenziato che è stato il provider a sostenere che l’obiettivo iniziale di 3 milioni di accessi/ora era troppo ambizioso, e ha quindi sottodimensionato il sito.

Invece di comprare dei bilanciatori di carico appropriati per gestire il traffico, il provider ha usato dei ‘bilanciatori software virtuali’, che costano molto meno ma sono anche molto meno affidabili. “Abbiamo consigliato di comprare dei bilanciatori hardware, ma era una questione di budget – spiega Sjoerd Siebinga, uno degli sviluppatori che lavorano al sito -: un paio di buoni bilanciatori hardware costa 30-40mila euro, e non avevamo soldi per comprarli“.

Un altro problema è che il codice è stato sviluppato in un blocco unico, rendendo quindi praticamente impossibili gli interventi per ‘scalare verso l’alto’ almeno alcune parti di software, in modo da reggere l’ondata del primo giorno di accessi.

Per la stessa natura del sito, inoltre, non aveva senso eliminare le immagini dalle pagine per renderne il download più veloce: “Se togliamo l’icona con l’immagine di Mozart, per esempio, come fa l’utente a capire dove deve andare per sentire la sua musica?“, osserva Purday.

Fino all’apertura ufficiale, continua il portavoce, molto era stato fatto, e tutto sembrava procedere per il meglio. “E’ stato un enorme lavoro procurarsi tutti questi contenuti da così tante fonti, ciascuno basato su specifiche tecniche e lingue diverse, e farli interoperare insieme: tutto sembrava funzionare“.

Europeana gira su un sistema operativo open source Linux Debian; il linguaggio usato è Java, e l’app server è Apache Tomcat. A questo punto, oltre a comprare un paio di robusti bilanciatori di traffico, spiega Purday, il team Europeana dovrà riconfigurare il sito e condurre dei “robusti test di carico” prima della riapertura fissata per metà dicembre.

Per la cronaca, la ricerca più frequente dei pochi che sono riusciti ad accedere al sito giovedì 20 è stata la Monna Lisa (Gioconda) di Leonardo da Vinci.

[via CWI]