Big Data : comment choisir son outil ?
Lorsqu’on est décidé à faire le pas du Big Data, la question qui se pose est de savoir comment choisir le bon outil. Voici quelques pistes pour vous aider.
Alors qu’Amazon Web Services, IBM, Informatica, Microsoft, Oracle, Pentaho, SAS, SAP, Tibco Jaspersoft, Talend et bien d’autres fournisseurs proposent des solutions de Big Data, faire son choix n’est pas simple lorsqu’on se décide à faire le premier pas vers cette nouvelle technologie.
La base d’un projet Big Data est de tout d’abord lui donner un objectif en termes de collecte et d’analyse des données. Faut-il vraiment passer à un outil de visualisation plus performant ? Faut-il analyser de gros volumes de données ? S’agit-il de données structurées ou non structurées ? Est-ce que des ressources internes sont disponibles pour analyser les données, créer les rapports, etc. ? Autant de questions à aborder en amont du projet.
Il est aussi nécessaire de donner un périmètre aux données, de connaitre leur volume, leur hétérogénéité, leur vélocité, savoir si elles sont générées par des machines, des capteurs des employés, des utilisateurs, ou des clients. Cette définition va servir de point central au choix de l’outil adéquat.
Alors que l’adoption d’un socle Hadoop était obligatoire il y a quelques années, ce qui impliquait de se débarrasser de l’existant pour adopter cette plateforme, il est possible aujourd’hui d’utiliser des plug-in pour intégrer les éléments du Big Data dans un environnement existant.
En terme de fonctionnalités, toutes les offres sérieuses proposent un socle de base comprenant la facilité d’usage des couches back-end et front-end, des temps de réponse rapide, des capacités d’analyse et de prédiction, la présence d’outils de visualisation, la prise en charge des appareils mobiles et l’agnosticité des formats de données supportés.
D’autres points sont à prendre en considération, mais ils dépendront plus du projet, du scénario retenu, le type d’outil n’étant pas le même pour du marketing, une analyse de trafic web ou une campagne sur Facebook que pour le domaine de la finance.
La question de l’intégrité des données se pose également, il s’agit d’un point essentiel. De ce point de vue, l’utilisation d’Hadoop peut poser problème vu que ses entrepôts sont excellents pour stocker des données contextuelles, mais moins efficaces pour les données critiques.
Limiter le potentiel d’un Big Data à la puissance d’un ordinateur sur site est également à prendre en considération alors que toute la puissance du Cloud est à disposition.
En prenant en compte tous ses points, le choix d’une solution Big Data ne sera pas forcément plus simple, mais permettra certainement de mieux comparer les différentes offres.
Liste non exhaustive des fournisseurs de Big Data :
- Amazon Web Services
- IBM
- Informatica
- Microsoft
- Oracle. A noter qu’Oracle propose un outil qui permet de mesurer la compatibilité de votre projet avec l’outil Hadoop
- Pentaho
- SAS
- SAP
- Tibco Jaspersoft
- Talend