Calculer un COUNT DISTINCT des lignes avec le composant Aggregate sous SSIS 2008




Comment faire un COUNT DISCTINCT en utilisant le composant Aggregate dans SSIS ? Dans SSIS, en passant par le composant Aggregate, on utilise le COUNT DISTINCT lorsque l’on souhaite avoir le nombre de lignes uniques d’une table.

 

1. Pour commencer, dans votre Data Flow, placer une source, le composant SSIS Aggregate et une destination. Dans notre exemple, la source sera le composant SSIS OLE DB Source et la destination sera Flat File Destination:

 

2. Le Data Flow n’est pas configuré, BIDS affiche donc des messages d’erreur sur les composant SSIS. Double cliquer sur le composant SSIS OLE DB Source, puis choisir une table :

 

3.Une fois la source choisie et configurée, configurer le composant SSIS Aggregate, dans l’onglet Aggregation, choisissez les colonnes où vous souhaitez effectuer le COUNT DISTINCT, puis dans operation choisir COUNT DISTINCT.

 

4. Maintenant que le composant SSIS Aggregate est configuré, reliez au composant SSIS Flat File Destination puis double cliquez sur ce dernier afin de choisir le fichier destinataire du chargement puis dans l’onglet Mapping, vérifiez que les colonnes sont bien celles sélèctionnées.

 

5. Une fois que tous les composant du package SSIS sont configurés, vous constaterai qu’il n’y a plus plus d’erreurs dans le Data Flow.

 

6. Vous pouvez maintenant lancer le package SSIS. Dans votre fichier plat, vous verrez s’afficher le nombre distinct de lignes pour les colonnes sélectionnées.

 

Le fichier contient le nombre 290, qui correspond au nombre de lignes en entrée.