Algèbre de Listes
Instructions
- Collez chaque liste dans son propre champ (un élément par ligne).
- Ajustez les options de normalisation si nécessaire (casse, accents, espaces, ponctuation).
- Choisissez l'opération souhaitée (union, intersection, différences ou comptages multi-ensembles).
- Utilisez Copier ou les formats de téléchargement pour exporter le résultat.
Description détaillée
Cet outil compare plusieurs listes et rend leurs relations explicites. Il répond à des questions telles que : « Qu'est-ce qui apparaît dans toutes les sources ? », « Qu'est-ce qui est propre à une seule liste ? », « Quels éléments sont partagés par au moins k listes ? » et « Combien d'occurrences totales chaque élément a-t-il dans l'ensemble des entrées ? » Les cas d'usage typiques incluent la fusion de jeux de données, la réconciliation de listes d'inventaire ou de contacts, la comparaison de notes de recherche et la mesure du consensus entre plusieurs contributeurs.
Il existe deux familles d'opérations, et le choix modifie le traitement des doublons :
- Les opérations de famille d'ensembles traitent chaque liste comme un ensemble : les lignes en double au sein d'une même liste ne changent pas le résultat.
- Les opérations de multi-ensemble traitent les doublons comme des comptages : les lignes répétées augmentent les totaux et peuvent modifier le résultat.
Opérations de famille d'ensembles (les doublons au sein de chaque liste sont ignorés) :
- Union : chaque élément unique apparaissant dans au moins une liste.
- Intersection : éléments présents dans toutes les listes (communs à toutes).
- Différence (A moins les autres) : éléments de la première liste qui n'apparaissent jamais dans les listes restantes.
- Différence symétrique : éléments qui ne sont pas partagés par toutes les listes (propres à certaines, mais pas communs à toutes).
- Au moins k listes : éléments apparaissant dans k listes ou plus.
- Exactement k listes : éléments apparaissant dans exactement k listes (ni plus, ni moins).
- Comptage de support : tableau indiquant combien de listes contiennent chaque élément.
Opérations de multi-ensemble (les doublons comptent) :
- Fréquence totale : nombre total d'occurrences dans toutes les listes pour chaque élément.
- Union multi-ensemble (max) : pour chaque élément, prend le comptage le plus élevé dans n'importe quelle liste individuelle.
- Intersection multi-ensemble (min) : pour chaque élément, prend le comptage le plus bas dans toutes les listes, en excluant les éléments absents de certaines listes.
- Somme multi-ensemble : pour chaque élément, additionne ses comptages dans toutes les listes.