Blog Cloudwatt

Les applications du Big Data

La dernière présentation de la journée des partenaires de Cloudwatt qui s’est tenue fin juin 2015 était dédiée à QuasarDB, représentée par Jean-Claude Tagger, Chief Operating Officer de l’éditeur de logiciels indépendant basé à Paris. Cette présentation a permis de nous éclairer sur le fonctionnement d’une base de donnée avec un modèle clé-valeur. Contrairement aux bases de données relationnelles structurées où les données sont bien rangées, les données sont ici stockées dans un « data lake ». Cependant, elles ont toutes un tag, une étiquette qui permet de retrouver facilement la donnée recherchée et de la modifier tout aussi simplement. Ce système distribué en peer-to-peer (ou pair-à-pair) permet de monter en charge bien plus facilement que pour une base de données relationnelle. Vous pouvez retrouver sur ce blog les deux autres résumés sur Cloudera et Affini-tech.

Image 01 - Jean-Claude Tagger, lors de sa présentation à la réunion partenaires Cloudwatt de juin 2015 -

L’utilisation du modèle de clé-valeur : apporter de la rapidité et de la flexibilité à la base de données

Lors de cette présentation, Jean-Claude Tagger a présenté le concept innovant développé par QuasarDB : leur base de données a pour objectif d’être rapide et performante, notamment grâce à sa particularité d’être distribuée en pair-à-pair. Aussi, QuasarDB utilise un modèle clé-valeur, où la donnée est identifiée par une clé. Cela permet de faciliter la recherche de donnée, grâce à l’utilisation d’étiquettes, à la manière des hashtags de Twitter. Ces étiquettes, ou tags, peuvent être des dates, des noms ou d’autres qualifications diverses.

Ce choix de modèle permet d’assouplir et de simplifier la gestion des données, en évitant de s’enfermer dans un schéma contraignant, peu propice à la modification et à la « scalabilité » (montée en charge). Le fait de s’échapper de ces schémas traditionnels structurés rend le système plus léger et permet donc d’être plus rapide dans la recherche et le traitement des données. Si toutefois le client a besoin d’avoir à sa disposition une architecture structurée, QuasarDB garantit en parallèle le relationnel, bien que la montée en charge soit moins facile à réaliser.

Pouvoir créer des nœuds (clusters) à l’infini et à la seconde

QuasarDB tire également son agilité, selon Jean-Claude Tagger, de capacité à créer des nœuds (aussi appelés clusters, désignant un groupe de serveurs agissant comme un seul système) à la seconde et à l’infini. Cette capacité à créer des nœuds de façon quasi instantanée se fait grâce à l’utilisation de l’algorithme Chord : il s’agit d’un réseau pair-à-pair, utilisant une topologie en anneau.

Image 02

  • l’algorithme Chord est un réseau pair-à-pair utilisant une topologie en anneau. On voit sur ce schéma 16 nœuds décentralisés -

La base de données utilise également OpenStack (un ensemble de logiciels open source) et peut fonctionner sur tous les systèmes d’exploitation. Pour conclure sur la présentation de sa solution, Jean-Claude Tagger insiste sur un point particulier : les Big Data ne sont pas nécessairement compliqués, il est également possible de les traiter de façon plus simple. Il prend ainsi pour exemple la frugalité appliquée aux Big Data : la base de données est frugale (peu consommatrice de ressources), ce qui lui permet d’être « embedded » ou résidente dans des objets connectés. Ces objets peuvent être des capteurs, des instruments de mesure pouvant faire remonter diverses informations à l’entreprise.

Une base de données qui s’applique à divers domaines

Après avoir présenté les caractéristiques la base de données QuasarDB, Jean-Claude Tagger a détaillé les secteurs où intervient sa solution. La finance de marché demande des traitements très longs, avec une value at risk (risque de marché d’un portefeuille d’instruments financiers) très complexe. La solution mise en place par QuasarDB permet d’accélérer les traitements et de faire du trading en temps réel. Dans un secteur comme la finance où la sécurité, la confidentialité et le respect des normes sont présents dans tous les processus de l’entreprise, la solution sera dite « on premises » : c’est à dire que celle-ci est installée et fonctionne directement chez le client, et non sur le Cloud (en SaaS). En dehors de la finance de marché, la base de données QuasarDB est aussi utilisée pour les calculs de risques, de prix et de données de marché, mais également dans les sciences (pharmacie, génétique, géologie et santé). Cette base de données est par ailleurs utilisée dans les services, notamment les sites de e-commerce et les utilities, ainsi que pour le RTB - real time bidding, l’achat en temps réel d’inventaires publicitaires en ligne, qui se compte en milliards de transactions quotidiennes.

A propos de QuasarDB

QuasarDB a été fondée en 2008 en tant que société de conseil, à une époque où les mots « Big Data » et « Nosql » n’existaient pas encore. En 2013, la société traite avec son premier client en finance de marché. En 2014, QuasarDB devient éditeur à 100%, après une levée de fonds. Dans un domaine où la plupart des acteurs sont américains, QuasarDB garantit la souveraineté numérique française. Son modèle commercial est entièrement basé sur sa distribution. QuasarDB choisit les meilleurs partenaires par segment : intégrateurs, éditeurs complémentaires, grands acteurs comme IBM, Microsoft, et Cloudwatt pour l’infrastructure. QuasarDB est un acteur de l’open source : seul le moteur de la solution n’est pas en open source. Cette technologie a ainsi pu être testée et éprouvée sur le terrain, ce qui fait de QuasarDB un acteur fiable et incontournable dans l’univers des Big Data.