Così il CERN gestisce i dati di trilioni di collisioni tra protoni

netapp


Vi siete mai chiesti che quantità di dati devono gestire gli scienziati del CERN grazie al lavoro svolto dall'LHC? Sono numeri con cui noi non abbiamomai avuto a che fare e mai ne avremo, probabilmente. Per organizzare i dati di trilioni di collisioni tra protoni, quelle che hanno contribuito alla scoperta del Bosone di Higgs, e ottenere prima possibile i risultati, gli scienziati ricorrono ad un'infrastruttura basata sullo storage NetApp, l'Agile Data Infrastructure, confidando su una ricerca e una gestione dei dati più efficienti (infrastruttura Intelligente), su operazioni senza interruzioni (infrastruttura Immortale) e sulla possibilità di espandersi senza limiti per far fronte alle esigenze della ricerca (infrastruttura Infinita).

Per avere un'idea della mole di dati, basti pensare che gli esperimenti nell'LHC generano seicento milioni di collisioni al secondo, il che equivale a un ritmo di circa 1 GB di dati grezzi al secondo. Per poter essere analizzato, questo volume di dati viene distribuito a fisici dislocati in 140 centri di calcolo in 35 Paesi.
A supporto dell'LCH, il CERN ha optato per database Oracle e si affida allo storage NetApp per memorizzare i dati nei database, uno dei quali conta oltre 4.1 trilioni di linee di dati. I dati operativi ammontano a più di 50 terabyte all'anno. Gli scienziati memorizzano la documentazione sulle misurazioni e sugli strumenti, utile per poi calibrare gli esperimenti.

Il CERN, inoltre, sfrutta la tecnologia Flash Cache di NetApp per migliorare le performance complessive e dimezzare lo spazio occupato nel data center, se si prende a riferimento l’infrastruttura tipicamente richiesta per gestire simili esigenze tecniche.

Ecco come gli stessi scienziati del CERN spiegano come utilizzano l’Agile Data Infrastructure:

[Fonte: NetApp]

Tags :