illuminate solutions

Data warehouses that don't compromise™

 

   
   
 
 Analyse ad hoc
 
 
Incremental Queries  
 
 Associative Queries  
 
 Data Mining comparé  









Accueil Technologie Analyse ad hoc

Si l'objectif est l'analyse ad hoc, pourquoi s'en priver ?

Les analystes de données ont depuis trop longtemps été limités par le langage SQL et les bases de données fortement optimisées et structurées. Il est pratiquement impossible d’effectuer de véritables analyses ad hoc dans ces environnements sans avoir de bonnes relations avec le service informatique. Et même dans ce cas, les délais sont souvent inacceptables.

Vous avez déjà constaté qu’il est peut être pénible, inefficace, long et frustrant d’essayer de faire vos analyses ad hoc avec des outils de requêtes qui ne sont pas réellement ad hoc. En fait, beaucoup d’entreprises se retrouvent avec des séries de requêtes ad hoc sans fin, et qui finissent par produire un flux de rapports interminable qu’il faut ensuite gérer et stocker. Le problème de fond est que vous êtes limité par :

  • La modélisation : vous pouvez uniquement poser des questions prédéfinies pour lesquelles les processus d’ETL et de base de données ont été optimisés.
  • L’indexation : les requêtes sont limitées aux relations qui ont été prédéfinies dans la base de données par le service informatique. La recherche d’une relation non standard (ou mieux encore, comprendre quelles sont les relations existantes et qui n’auraient pas été identifiées lors de la modélisation) correspond à un nouveau projet informatique.
  • Données résumées : la portée des requêtes, et par là même votre analyse, est limitée au niveau des données détaillées incluses dans la base de données, lesquelles sont dans la plupart des cas dénormalisées, pré-jointes et résumées. Même si les données résumées peuvent suffire pour certaines analyses, dans la plupart des cas vous ne savez pas vraiment ce qui manque.

Pour minimiser ces problèmes, les services informatiques construisent des datamart supportant des requêtes guidées et structurées. La flexibilité est quelque peu améliorée, mais votre analyse reste limitée à « ce qu’il y a dans le cube » (à savoir les données et la conception fournies par le service informatique). Cette façon de faire ne dure qu'un temps. Vous réaliserez progressivement que vous ne disposez pas des données nécessaires pour effectuer de véritables analyses ad hoc. Et donc vous contactez de nouveau le service informatique. Les utilisateurs comme les informaticiens comprennent bien que tout cela prend du temps et de l’argent, et qu’il y a sûrement mieux à faire pour qu’une entreprise soit performante et rentable. Mais c'est le mieux que vous puissiez faire.

Exigez le meilleur de l'analyse ad hoc

Le « correlation database » d'illuminate vous laisse penser librement et explorer les différentes questions et réponses. Vous n'avez pas à informer le service informatique à l'avance des questions que vous aimeriez poser. En fait, vous ne devez même pas connaître toutes les questions. Vous devez seulement savoir que les données de base existent quelque part dans l'organisation et qu'elles sont situées dans le data warehouse ou le datamart. Chacune des valeurs et corrélations de données est indexée grâce au stockage « Value-Based » (VBS) de la base de données, automatiquement, lorsque les données sont chargées. Ce qui signifie que vous pouvez poser n'importe quelle question. Oui, n'importe quoi, aussitôt que les données sont chargées. Un raccourci vers l'analytique !

Maintenant que vous disposez des données nécessaires, il vous est possible d’explorer vos données comme vous analysez un problème, c’est-à-dire de façon incrémentale, avec notre logiciel iCorrelate. Interrogez, analysez. Interrogez à nouveau, analysez en profondeur. C’est ce que nous appelons les incremental queries. Elles vous permettent d’effectuer un drill down, drill up et drill across jusqu’à ce que vous obteniez la réponse souhaitée. Il est inutile de connaître la structure des données, il vous suffit de penser, puis d’interroger. Vous pouvez sauvegarder les résultats de ces requêtes en tant que procédures stockées pour y accéder en utilisant n’importe quel outil de restitution compatible ODBC/JDBC afin d’affiner votre analyse et/ou la distribuer.

Mais que faire si vous ne savez pas par où commencer votre analyse ? Grâce aux associative query, votre analyse peut prendre forme à mesure que les questions vous viennent à l’esprit après avoir identifié toutes les relations associées à n’importe quelle donnée spécifique. Et tous les niveaux de détail peuvent être inclus. Les incremental queries et associative queries ne nécessitent pas de constructions en SQL.

Utilisation rapide de vos données

Pour utiliser les outils Excel, SAS ou SQL, vous devez passer beaucoup de temps à mettre en place, nettoyer, préparer et manipuler les données afin qu'elles conviennent à une utilisation selon vos modèles algorithmiques ou analytiques. Les fichiers plats des systèmes transactionnels, en format CSV ou texte, doivent être préparés et nettoyés avant utilisation. Ce qui est long et compliqué.

Avec la correlation database d'illuminate, vous pouvez vérifier vos données lors du processus de chargement, identifier les valeurs nulles et les problèmes de qualité. Elle génère automatiquement des statistiques résumées concernant les données, comme par exemple les valeurs uniques, le minimum et maximum et la somme pour chaque colonne. Il est facile de comprendre et d'évaluer les données avant utilisation, ce qui accélère aussi la préparation, le nettoyage et l'organisation des données pour tous types d'analyse ad hoc.

Améliorez vos analyses

Illuminate réduit le temps requis pour préparer et organiser les données, et fournit de nouvelles capacités pour réaliser des analyses ad hoc réelles pour des tâches telles que la segmentation, des analyses de régression ou du panier d'achat. Vous pouvez combiner les Associative Queries et les Incremental Queries afin d'affiner vos résultats d'achat par sexe, par région démographique ou autres critères, sans filtre ou inclusion de feuille de calcul, jusqu'à ce que vous obteniez vos réponses.

Améliorez vos algorithmes

Avec illuminate, vous pouvez exécuter les algorithmes de segmentation existants et autres requêtes avancées au travers de n'importe quel logiciel de restitution compatible ODBC. Ou bien utiliser iCorrelate (qui vous affranchit des contraintes de SQL) et créer puis stocker ces requêtes pour les exécuter à tout moment. En cas de modification des besoins ou des données, il n'est pas nécessaire de convertir, préparer, indexer et transformer ces données à charger.

Les modèles algorithmiques sont conçus selon un procédé répétitif de tests et d'évaluations jusqu'à l'obtention du meilleur modèle. La création et l'exécution rapide des Incremental et Associative Queries avec iCorrelate simplifient et accélèrent le développement de modèles, et facilitent l'amélioration continue et les analyses ad hoc.

C'est le résultat qui compte

Les datamart et « correlation data warehouse » sont conçus et déployés plus rapidement qu'avec les autres alternatives. Une fois élaborée, l'analytique est rapide et véritablement flexible. Nous vous invitons à comparer le processus de data mining en utilisant la technologie conventionnelle RDBMS avec le « correlation database » d'illuminate qui :

  • Réduit le temps de mapping et de recherche de données lors de l'évaluation de données de sources brutes. Ce qui est particulièrement intéressant dans les environnements où de nouveaux types ou de nouvelles sources de données sont fréquemment introduits.
  • Réduit la complexité et le temps requis pour effectuer le data staging et la préparation.
  • Permet de poser des questions incrémentales pour une véritable analyse ad hoc. Illuminate permet d'éliminer les contraintes liées aux bases de données relationnelles et la nécessité de télécharger des données dans des feuilles de calcul en vue de leur analyse. Ceci vous permet de poser toutes questions concernant vos données sans vous soucier de la structure sous-jacente de la base de données.
  • Réduit énormément le temps d'analyse et de réponse.
  • Vous permet de créer des modèles algorithmiques avec un accès direct à la base de données, sans les limites du SQL.