Le vocabulaire partagé par des sous-groupes d'une communauté
On propose un indice de vocabulaire partagé γ afin d'évaluer les ressemblances et les différences entre les ensembles de mots utilisés dans deux sous-groupes d'une communauté. Cet indice mesure la différence entre le nombre moyen de mots partagés par deux locuteurs, l'un dans le premier groupe, l'autre dans le deuxième et le nombre prédit par une hypothèse nulle basée sur une distribution globale de la fréquence des mots. La formulation de γ permet des variations dans la taille de l'échantillon...