Big Data: il caso d’utilizzo di Airbnb

Un articolo dedicato all'infrastruttura tecnica Airbnb e alle modalità con le quali il noto servizio gestisce un'elevata quantità di dati

Airbnb logo

Il portale CloudTech ha avuto modo di intervistare Riley Newman, responsabile del dipartimento data science presso Airbnb, azienda con sede a San Francisco dietro all’omonima e famosa piattaforma online per la ricerca di camere/alloggi nel mondo. La chiaccherata tra l’editorialista Bernard Marr ed il dirigente ha svelato interessanti dettagli riguardanti l’infrastruttura alla base del servizio e le modalità con le quali sono gestite differenti tipologie di dati. Vediamo meglio di cosa si tratta.

Newman sottolinea in prima battuta come sia essenziale per la compagnia ricostruire quella serie di eventi che hanno portato alla registrazione di un’azione o un evento (o in sintesi alla creazione di un dato) frutto di una scelta dell’utente: “tale tipologia di feedback può [rivelarsi immensamente utile per] decisioni inerenti la crescita della community, lo sviluppo di nuovi prodotti e l’organizzazione delle risorse in base alle priorità… trasformiamo la voce dei clienti in un linguaggio più consono [ad operazioni di decision making]”.

Airbnb: le piattaforme per l’analisi dei dati

L’impiego di tecnologie destinate all’analisi dei dati era quindi inevitabile per l’ottimale crescita e sviluppo del servizio: non sorprende quindi che Airbnb abbia realizzato “in casa” un piattaforma machine learning soprannominata Aerosolve. Tra le mansioni di quest’ultima vi è ad esempio quella di fornire indicazioni agli hoster su quale sia il prezzo più adatto alla stanza/appartamento che vogliono affittare, operazione che tiene conto di un elevato numero di variabili (posizione, periodo dell’anno, tipologia di alloggio, collagamenti con i mezzi pubblici etc.) e dell’analisi delle foto allegate dall’inserzionista.

I dati analizzati sono sia di “natura interna” che “esterna”. Per quanto riguarda i primi si tratta di un mix di dati strutturati e non strutturati ovvero foto fornite da inserzionisti, dati sulle transazioni, recensioni degli utenti, dettagli sull’alloggio (Wi-Fi,  numero di letti e stanze etc.). Per dati esterni si intendono invece variabili come lo svolgimento di un particolare evento, un alloggio ad Edimburgo durante il popolare festival, spiega l’intervistato, avrò un costo maggiore rispetto ad un altro periodo dell’anno.

Anche i dipendenti della compagnia, inclusi coloro che non appartengono alla divisione data science, hanno a disposizione una loro piattaforma per la consultazioni / ricerca di vari dati – soprannominata Airpal.

Infrastruttura e risultati ottenuti

Airbnb gestisce circa 1.5 petabyte di dati sottoforma di Hive managed tables in cluster HDFS (Hadoop Distributed File System) su piattaforma AWS ( Airbnb si affida al servizio EC2 nello specifico). Per quanto riguarda la gestione delle ricerche nel database (query dati), la compagnia ha optato per il database opensource Presto – ideato da Facebook. Come sottolineato dallo stesso intervistato, la soluzione AWS Redshift, impiegata in prima battuta, non consentiva di individurare celermente eventuali bug e distribuire opportuni aggiornamenti di sicurezza.

Tirando le somme, si chiede ad un certo punto l’editorialista, il sistema ideato da Airbnb ha avuto realmente effetti positivi sul business aziendale? A rispondere è naturalmente lo stesso intervistato: si tratta di un qualcosa difficile da quantificare ma che a fronte del numero  di query inoltrate (dal personale tecnico e non su Airpal, in generale 1/3 dei dipendenti ha utilizzato la piattaforma) e della crescita di fatturato della stessa Airbnb, sembra probabilmente contribuire al successo dell’impresa.
Fonte dell’articolo.

 

Facci sapere cosa ne pensi!

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *