Questions D'entretien

Top 50 des questions et réponses des entretiens de test ETL

2 janvier 2022

En termes de calcul, Extraire, Transformer, Charger (ETL) est défini comme la technique générale de copie des données obtenues à partir de sources uniques ou multiples vers un système de destination qui représentera les données différemment de celles de la source.

Questions d'entretien sur les tests ETL

Table des matières

Qu'est-ce qu'un test ETL ?

Nous faisons le Test ETL pour s'assurer que les données chargées d'une source vers la destination après une transformation d'entreprise sont précises. Cela impliquera la vérification des données à différentes étapes intermédiaires qui sont utilisées entre la source et la destination.

Si vous avez prévu un entretien de test ETL, vous devez passer par nos questions et réponses TOP ETL Interview. Nous avons noté les questions et réponses d'entrevue ETL les plus fréquemment posées, et veuillez parcourir l'intégralité de l'article.

Top 50 des questions et réponses des entretiens de test ETL

1. Expliquer les opérations de test ETL ?

Le test ETL implique les opérations mentionnées ci-dessous :

  1. Il validera le mouvement des données de la source vers le système cible.
  2. Il effectue la vérification du nombre de données dans le système source et cible.
  3. Il vérifie la transformation et l'extraction selon les exigences et les attentes.
  4. Il vérifie si les relations de table se joignent et les clés sont préservées pendant la transformation.

2. Différencier les tests ETL des tests manuels ?

Test ETL Test manuel
Il vérifie si les données se déplacent comme prévu.C'est une méthode d'observation et de test.
Il est rapide et systématique et vise à fournir les meilleurs résultats.Cela demande du temps et des efforts, et il est sujet à plus d'erreurs.
Il ne nécessite aucune connaissance technique supplémentaire autre que la compréhension du logiciel.Cela nécessite une connaissance technique des scripts SQL et Shell.

3. Définir ETL ?

En termes de calcul, Extraire, Transformer, Charger (ETL) est défini comme la technique générale de copie des données obtenues à partir de sources uniques ou multiples vers un système de destination qui représentera les données différemment de celles de la source.

4. Lister les types d'applications Data Warehouse ?

  1. Traitement des informations
  2. Traitement analytique
  3. Exploration de données
Voir également Top 100 des questions et réponses d'entrevue JavaScript

5. Quel est le besoin de tests ETL ?

  1. Pour obtenir rapidement et les meilleurs résultats.
  2. Pour garder un œil sur les données qui sont transférées d'un système à un autre système.
  3. Pour suivre la vitesse et l'efficacité du processus.

Questions et réponses de l'entretien de test ETL

6. Quel est le besoin d'une zone de préparation dans le processus ETL ?

Une zone de transit est également connue sous le nom de zone d'atterrissage, est définie comme une zone de stockage intermédiaire qui est utilisée pour le traitement des données pendant le processus d'extraction, de transformation et de chargement (ETL). La zone de transfert de données se situe entre la source de données et la cible de données, qui sont les entrepôts de données, les magasins de données ou d'autres référentiels de données.

7. Lister les différents outils utilisés en ETL ?

  1. Flux de décision Cognos
  2. SAS Serveur ETL d'entreprise
  3. Constructeur d'entrepôt Oracle
  4. Objets métier XI
  5. Entrepôt commercial SAS

8. Énumérez les responsabilités d'un testeur ETL ?

Les responsabilités d'un testeur ETL sont énumérées ci-dessous :

  1. Ils doivent valider les fichiers PMS mainframe migrant vers DB2.
  2. Ils doivent tester le schéma de la base de données avec l'aide des architectes de données en utilisant ERWIN.
  3. Ils doivent avoir une expérience de travail avec DB2, Terada.
  4. Ils doivent gérer l'inventaire du service et résoudre les problèmes de test, d'inventaire et de rapport.

9. Expliquer le processus de test ETL ?

    Analyse du besoin: Le testeur doit comprendre la structure de l'entreprise et ses besoins spécifiques.Validation et estimation des tests :Dans cette phase, l'estimation du temps et de l'expertise nécessaires pour poursuivre la procédure est effectuée.Planification des tests et conception de l'environnement de test: Dans cette phase, sur la base des entrées des estimations, l'environnement ETL est planifié et travaillé en fonction de celui-ci.Préparation et exécution des données de test: Ici, les données du test seront préparées et exécutées conformément aux exigences.Rapport sommaire: Ici, à la fin du test, le testeur doit préparer un bref rapport de synthèse pour improviser et conclure.

10. Pouvez-vous citer quelques bogues ETL ?

Types de bogues ETL

Quelques-uns des bogues ETL sont répertoriés ci-dessous :

    Bogue d'entrée/sortie :Ici, les valeurs valides ne sont pas acceptées et les valeurs invalides sont acceptées.Bogues de condition de chargement: Cela ne permettra pas à plusieurs utilisateurs et à la charge attendue du client.Bogues de condition de course: Ici, le système ne peut pas exécuter les plates-formes clientes.Bogues de contrôle de version: Cela se produira dans les tests de régression.Bogues matériels: Ici, l'appareil ne répond pas à l'application.
  1. Bogues de la source d'aide
  2. Bogue lié au partitionnement de classe d'équivalence (ECP)

Questions et réponses de l'entretien de test ETL

11. Que sont les attributs de dimension dans ETL ?

Les attributs de dimension dans ETL sont définis comme les différentes colonnes d'une table de dimension.

12. Définir le fait et énumérer les types de faits ?

Un fait est défini comme un composant central du modèle multidimensionnel composé des mesures à analyser. Les faits sont généralement liés aux dimensions.

Les types de faits sont :

  1. Faits semi-additifs
  2. Faits non additifs
  3. Faits additifs

13. Définir les feuilles de mappage ETL ?

Les feuilles de mappage ETL se composent de toutes les informations des tables source et destination qui incluent chaque colonne et également leur recherche dans les tables de référence.

14. Faire la différence entre les outils OLAP et les outils ETL ?

Outils OLAP Outils ETL
Les données obtenues à partir du processus ETL sont utilisées par l'outil OLAP pour visualiser les données sous différentes formes.Un ETL est une technique d'extraction, de chargement et de transformation de données sous une forme significative.
Exemple : Business Objects, Cognos, etc.Exemple : étape de données, Informatica, etc.

15. Définir les cubes et les cubes OLAP ?

Une Cube OLAP est définie comme une base de données multidimensionnelle principalement optimisée à des fins de reporting.

Cubes peuvent être définis comme les unités de traitement de données qui sont principalement composées de tables de faits et de dimensions de l'entrepôt de données.

Questions et réponses de l'entretien de test ETL

16. Comment extraire des données SAP avec Informatica ?

  1. En utilisant l'option de connexion d'alimentation, nous pouvons extraire des données SAP à l'aide d'Informatica.
  2. Ensuite, nous devons installer et configurer l'outil PowerConnect.
  3. Maintenant, importez la source dans Source Analyzer. Dans l'étape suivante, nous générons le code ABAP utilisé pour le mappage, puis Informatica peut extraire les données de SAP.
  4. Maintenant, pour connecter et importer les sources à partir de systèmes externes, nous utilisons Power Connect.

17. Pouvez-vous énumérer quelques cas de test et les expliquer ?

    Vérification des données- Ici, chaque aspect relatif aux données, comme la vérification des données, la vérification nulle, la vérification du nombre, est testé dans ce cas.Validation des documents de mappage– Il vérifie si les informations ETL sont fournies dans le Mapping Doc.Problèmes d'exactitude– Ici, les données mal orthographiées, les données nulles et les données inexactes sont testées.

18. Comment écrire des cas de test pour les tests ETL ?

  1. Assurez-vous que toutes les données attendues sont chargées dans la table cible.
  2. Vous devez comparer le nombre d'enregistrements entre la source et la cible.
  3. Vous devez vérifier les enregistrements rejetés.
  4. Vérifiez les données ; il ne doit pas être tronqué dans la colonne des tables cible.
  5. Vérifier l'analyse des valeurs limites.
  6. Vous devez comparer les valeurs uniques des champs clés entre les données chargées dans WH et les données source.
Voir également Top 100 des questions et réponses d'entrevue Ansible

19. Définir le niveau de traçage et répertorier les types de niveau de traçage ?

Le niveau de traçage peut être défini comme la quantité de données placées dans les fichiers journaux. Un niveau de traçage peut être classé en deux types :

le niveau normal définit le niveau de traçage de manière exhaustive.

Verbeux définit les niveaux de traçage à chaque ligne.

20. Faire la différence entre Power Mart et Power Center ?

Power Mart Centre d'alimentation
Il ne prend en charge aucune source ERP.Il prend principalement en charge les sources ERP telles que SAP, people soft, etc.
Il ne convertit pas local en référentiel global.Il convertit principalement le référentiel local en référentiel global.
Il traite un faible volume de données.Il traite un énorme volume de données.

Questions et réponses de l'entretien de test ETL

21. Définissez le terme Grain de fait ?

En termes d'entreposage de données, une table de faits contient principalement des métriques, des mesures ou des faits d'un processus métier. Le grain d'une table de faits définira le niveau le plus atomique auquel les faits sont définis. Le grain d'un tableau de faits sur les ventes sera indiqué en volume des ventes par jour par produit par magasin.

22. Lister les étapes incluses dans la zone Staging ?

Les étapes incluses dans la zone Staging sont :

  1. Extraction des données sources et transformation des données, c'est-à-dire restructuration
  2. Transformation des données (c'est-à-dire nettoyage des données, transformation de la valeur).
  3. Affectations de clés de substitution.

23. Définir la purge des données ?

La purge est définie comme la technique consistant à libérer de l'espace dans la base de données ou à supprimer des données obsolètes qui ne sont pas indispensables au système. Le processus de purge est basé sur l'ancienneté des données ou le type de données.

24. Définir des mesures ?

Les mesures sont généralement les données numériques sur la base des colonnes d'une table de faits.

Questions et réponses de l'entretien de test ETL

25. Définir les objets de schéma ?

Les objets de schéma peuvent être définis comme la structure logique qui fait directement référence aux données de la base de données. Les objets de schéma incluent la vue, les tables, les synonymes de séquence, les clusters, les index, les packages de fonctions et les liens de base de données.

26. Définir la transformation ?

La transformation peut être définie comme le lieu de stockage où la modification, la génération et la transmission des données ont lieu.

27. Pouvez-vous définir les termes Session, Worklet, Mapplet et Workflow ?

Worklet : Il définit un ensemble spécifique de tâches données

Flux de travail : Il est défini comme un ensemble d'instructions qui indiqueront au serveur comment exécuter des tâches.

Session : Il est défini comme un ensemble de paramètres qui indiqueront au serveur comment déplacer les données des sources vers la cible.

Mapplet : Il arrange ou crée des ensembles de transformation.

28. Qu'est-ce qu'un schéma de faits sans faits ?

Un schéma de faits sans faits est défini comme la table de faits sans aucune mesure. Il est principalement utilisé pour afficher le nombre d'occurrences d'événements.

29. Expliquer le processus de test ETL ?

Le test ETL est effectué en cinq étapes, à savoir,

  1. Identification des sources de données et des besoins
  2. L'acquisition des données
  3. Implémentation de la logique métier et de la modélisation dimensionnelle
  4. Construire et remplir les données
  5. Créer des rapports

30. Lister les types de tests ETL ?

Tests de validation de la production : Ce type de test ETL est généralement effectué sur les données lors de leur transfert vers les systèmes de production.

Test source à cible ou test de validation : Ce type de test est effectué pour valider si les valeurs de données qui sont transformées sont les valeurs de données attendues.

Mises à niveau des applications : Ce type de test est généré automatiquement en économisant le temps de développement du test.

Test des métadonnées  : Ce test comprendra des tests de vérification du type de données, de vérification de la longueur et de vérification des index/contraintes.

Test d'exhaustivité des données : Ce test est effectué pour vérifier que les données attendues sont chargées dans une cible à partir d'une source, un test d'exhaustivité des données est effectué.

Test d'exactitude des données : Ce type de test est effectué pour s'assurer que les données sont chargées avec précision et transformées comme prévu.

Test de transformation de données : Ici, le test de la transformation des données est effectué car, dans de nombreux cas, nous ne pouvons pas y parvenir en écrivant une requête SQL source, puis en comparant la sortie avec la cible.

Test de qualité des données : Afin d'éviter toute erreur due à la date ou au numéro de commande au cours du processus commercial, des tests de qualité des données sont effectués.

Tests ETL incrémentiels : Ce test est effectué pour vérifier l'intégrité des données des anciennes et des nouvelles données avec l'ajout de nouvelles données.

Test de l'interface graphique/navigation : Ce test est effectué pour vérifier les aspects de navigation ou d'interface graphique des rapports frontaux.

Questions et réponses de l'entretien de test ETL

31. Nommez les deux documents utilisés par le testeur ETL ?

Lors de l'exécution des tests ETL, deux documents sont utilisés par un testeur ETL, ils sont :

    Feuilles de mappage ETL :Les feuilles de mappage ETL se composent de toutes les informations des tables source et destination qui incluent chaque colonne et également leur recherche dans les tables de référence.Schéma de base de données source, cible :Ces documents doivent être conservés à portée de main pour vérifier tout détail dans les feuilles de cartographie.
Voir également Top 100 des questions et réponses d'entrevue JavaScript

32. Lister les meilleures pratiques pour les tests ETL ?

  1. Assurez-vous que les données sont correctement transformées.
  2. Les données projetées doivent être chargées dans l'entrepôt de données sans aucune perte ni troncature de données.
  3. Assurez-vous que l'application ETL rejette et remplace de manière appropriée les valeurs par défaut et signale les données non valides.
  4. Le testeur doit s'assurer que les données sont chargées dans l'entrepôt de données dans les délais prescrits et prévus pour confirmer l'évolutivité et les performances.
  5. Toutes les méthodes doivent avoir des tests unitaires appropriés quelle que soit la visibilité.
  6. Afin de mesurer l'efficacité, tous les tests unitaires doivent utiliser des techniques de couverture appropriées.
  7. Créer des tests unitaires ciblant les exceptions

33. Définir les tests de performance dans ETL ?

Test de performance dans ETL est défini comme une technique de test utilisée pour s'assurer qu'un système ETL gérera la charge de divers utilisateurs et transactions. L'objectif principal des tests de performances ETL est d'optimiser et d'améliorer les performances de la session en identifiant et en éliminant les goulots d'étranglement des performances.

Les bases de données, les mappages, les sessions et les systèmes cible et source peuvent avoir des goulots d'étranglement de performances.

34. Nommez le meilleur outil utilisé pour les tests de performance ?

Le meilleur outil utilisé pour les tests de performances ou le réglage est Informatica.

Questions et réponses de l'entretien de test ETL

35. Qu'est-ce qu'un test ETL automatisé ?

Une solution de test ETL automatisée est conçue pour trouver les problèmes de données dans les processus ETL. Les moteurs uniques prenant en charge SQL et Groovy permettront des tests et une surveillance de bout en bout.

36. Énumérez les types de transformation ?

Il existe deux types de transformation, à savoir,

Transformation active : Il est principalement utilisé pour modifier les lignes de données et le nombre de lignes d'entrée qui les traversent. Un exemple est la transformation Filtre.

Transformation passive : Il est principalement utilisé pour obtenir des données d'entrée et de sortie dans le même nombre de lignes. Un exemple est la transformation de recherche.

37. Qu'est-ce que le partitionnement et répertoriez les types de partitionnement ?

Le partitionnement peut être défini comme la division du stockage des données afin d'améliorer les performances. Il existe deux types de partitionnement, à savoir,

Partitionnement circulaire : C'est un type de partitionnement qui est fait pour distribuer les données uniformément dans toutes les divisions, et il est généralement appliqué lorsque le nombre de lignes à traiter est le même.

Partitionnement par hachage : Il s'agit d'un type de partitionnement effectué principalement pour regrouper les données en fonction de clés et utilisé pour garantir que les groupes traités se trouvent dans une partition similaire. Le partitionnement Hush vise à trouver des applications dans le serveur Informatica.

38. Qu'est-ce qu'Informatica ?

Informatica se définit comme une société de développement de logiciels qui proposera des produits liés à l'intégration de données. Les produits de l'informatique sont principalement utilisés par l'ETL, la qualité des données, le masquage des données, la gestion des données de référence, etc.

39. Y a-t-il un avantage à utiliser l'adaptateur de destination DataReader ?

Le principal avantage de l'utilisation d'un adaptateur de destination DataReader est qu'il remplit un jeu d'enregistrements ADO en mémoire et qu'il expose les données d'une tâche DataFlow en implémentant une interface DataReader de manière à ce que l'autre application puisse consommer les données.

40. Qu'est-ce que SSIS ?

Services d'intégration SQL Server est défini comme un composant du logiciel de base de données Microsoft SQL Server utilisé pour effectuer un large éventail de tâches de migration de données. Il s'agit d'une plate-forme pour les applications de flux de travail et l'intégration de données. Il comporte également un outil d'entreposage de données utilisé pour l'extraction, le chargement et la transformation des données.

Questions et réponses de l'entretien de test ETL

41. Définir la transformation du filtre ?

La transformation de filtre est définie comme une transformation active utilisée pour filtrer les enregistrements sur la base de conditions de filtre.

42. Quel est le besoin d'une vérification des données comme cas de test ?

Avec un scénario de test de vérification des données, nous pouvons facilement obtenir les informations relatives à la vérification des données, à la vérification des nombres et à la vérification nulle.

43. Faire la différence entre une recherche non connectée et une recherche connectée ?

Recherche non connectée Recherche connectée
Ici, un seul port de sortie peut être utilisé.Ici, nous pouvons utiliser plusieurs ports de sortie.
Ici, nous utilisons le cache statique.Ici, nous pouvons utiliser statique ou dynamique.

44. Quelle est l'importance du cas test du problème d'exactitude ?

Le cas de test des problèmes d'exactitude nous aidera à comprendre les données mal orthographiées, les données nulles, les données inexactes.

45. Quel est le but du cache dynamique et du cache statique dans la transformation connectée et non connectée ?

Le cache statique est principalement utilisé pour les fichiers plats, tandis que le cache dynamique est principalement utilisé pour mettre à jour la table principale en modifiant lentement les dimensions.

Questions et réponses de l'entretien de test ETL

46. ​​Définir la vue de la source de données ?

Une vue de source de données se compose généralement des métadonnées qui définissent les objets sélectionnés à partir d'une ou plusieurs sources de données sous-jacentes ou des métadonnées utilisées pour générer le magasin de données relationnelles sous-jacent.

Outre les questions techniques, l'intervieweur posera des questions générales et des questions basées sur des scénarios, auxquelles vous devrez répondre en fonction de votre expérience. Veuillez également vous préparer aux questions ci-dessous.

Questions et réponses de l'entretien de test ETL

47. Pourquoi les tests ETL ?

48. Parlez-moi de notre entreprise ?

49. Pourquoi devrions-nous vous embaucher ?

50. Quelles sont vos forces et vos faiblesses ?

Bonne chance avec votre entretien de test ETL, et j'espère que nos questions et réponses d'entretien de test ETL vous seront utiles. Assurez-vous de vérifier notre Questions d'entretien chez Informatica et Questions d'entretien chez ETL qui pourraient vous être utiles.