Quand le sujet du Cloud est considéré dans un contexte HPC, il peut être tentant de faire une comparaison directe avec un cluster de calcul on-premise, et d'arriver rapidement à des objections comme un coût au cœur plus élevé sur le Cloud, ou la non disponibilité de certaines technologies utilisées dans le cadre du HPC. Et ainsi manquer toute la valeur que le Cloud apporte à des institutions comme le CERN ou des entreprises comme Schlumberger et la Société Générale.
L'erreur est de réduire le Cloud à une simple offre d’hébergement, et ainsi d’ignorer tous les nouveaux cas d’usages rendus possibles par l’agilité du Cloud. En effet, le Cloud apporte plus que du matériel, il apporte un service managé d’allocation de ces ressources. De ce fait, un changement de paradigme doit être opéré.
Lorsque les ressources sont facturées sur une échelle de temps long, il convient d’en optimiser l’utilisation afin d’avoir la meilleure capacité au meilleur coût. De ce fait, cela implique de choisir des systèmes homogènes en ressources, de les dimensionner en fonction de besoins anticipés et de s’assurer que les différents besoins pourront être orchestrés dans le temps de façon à saturer les ressources disponibles. Au contraire, dans le cadre d’une approche Cloud, les ressources, perçues comme illimitées, peuvent être allouées à la demande en fonction de la charge requise. Le Cluster virtuel à la demande, ou Cluster As A Service, permet ainsi à chaque utilisateur de disposer de sa propre infrastructure de calcul dimensionnée et adaptée pour traiter son problème le plus efficacement possible. Les utilisateurs obtiennent leurs résultats plus rapidement puisque leurs jobs s’exécutent en parallèle et les ressources coûtent moins cher puisqu’elles sont mieux utilisées.
Dans le cas particulier d’infrastructures de calcul dédiées à exécuter des tâches non couplées et tolérantes aux pannes, il existe une optimisation financière supplémentaire. En effet, afin de faciliter la maintenance et l’équilibrage de charge de leurs datacenter, les fournisseurs cloud proposent des machines à prix réduit à la condition qu’ils puissent les récupérer à tout instant si nécessaire. En utilisant ce type de machine, le coût de calcul est ainsi considérablement réduit. Il suffit en échange de relancer la tâche interrompue sur une autre machine de calcul.
Récemment, dans le cadre d’un projet autour du véhicule autonome, ANEO a imaginé une architecture entièrement managée et automatisée de Clusters à la demande. En attendant la publication d’une série d’article sur le sujet, nous serons présents le 19 et 20 Juin au salon Teratec pour en discuter.