The search session has expired. Please query the service again.
The search session has expired. Please query the service again.
Microaggregation is a statistical disclosure control technique for microdata. Raw microdata (i.e. individual records) are grouped into small aggregates prior to publication. Each aggregate should contain at least k records to prevent disclosure of individual information. Fixed-size microaggregation consists of taking fixed-size microaggregates (size k). Data-oriented microaggregation (with variable group size) was introduced recently. Regardless of the group size, microaggregations on a multidimensional...
Les concepts d'éléments R-ressemblants à un prototype X et de R-regroupement d'objets introduits dans cet article, sont basés sur la notion de relation de S-comparaison R définie au moyen d'un indice scalaire de similarité défini entre sous-ensembles flous. Cette relation tient compte du fait que la similarité et la non-dissimilarité des sous-ensembles flous ne sont pas en général des synonymes. Une technique de coalescence floue basée sur des R-regroupements maximaux est également introduite.
In this paper, we investigate the convergence behavior of the asymmetric Deffuant-Weisbuch (DW) models during the opinion evolution. Based on the convergence of the asymmetric DW model that generalizes the conventional DW model, we first propose a new concept, the separation time, to study the transient behavior during the DW model's opinion evolution. Then we provide an upper bound of the expected separation time with the help of stochastic analysis. Finally, we show relations of the separation...
Correspondence analysis followed by clustering of both rows and columns of a data matrix is proposed as an approach to two-way clustering. The novelty of this contribution consists of: i) proposing a simple method for the selecting of the number of axes; ii) visualizing the data matrix as is done in micro-array analysis; iii) enhancing this representation by emphasizing those variables and those individuals which are 'well represented' in the subspace of the chosen axes. The approach is applied...
Grammatical Evolution (GE) is a novel data-driven, model-induction tool, inspired by the biological gene-to-protein mapping process. This study provides an introduction to GE, and demonstrates the methodology by applying it to construct a series of models for the prediction of bankruptcy, employing information drawn from financial statements. Unlike prior studies in this domain, the raw financial information is not preprocessed into pre-determined financial ratios. Instead, the ratios to be incorporated...
Our concern here, is the characterization of dissimilarity
indexes defined over finite sets, whose spatial representation is
spherical. Consequently, we propose a methodology (Normed
MultiDimensional
Scaling) to determine the spherical euclidean representation of a set of
items
best accounting for the initial dissimilarity between items. This
methodology
has the advantage of being graphically readable on individual qualities
of
projection like the normed PCA, of which it constitutes a
generalization....
Les dissimilarités multivoies sont une généralisation naturelle des dissimilarités usuelles deux voies. Dans ce papier, des classes de dissimilarités multivoies sont étudiées, ainsi que des modèles de passage d'un nombre de voies donné à un autre nombre de voies. Une application à la spécification de systèmes classifiants a conduit à une bijection entre une classe de dissimilarités multivoies et une famille de systèmes stratifiés de classifccation.
The known hierarchical clustering scheme is equivalent to the concept of ultrametric distance. Every distance can be represented in a spatial model using multidimensional scaling. We relate both classes of representations of proximity data in an algebraic way, obtaining some results and relations on clusters and the eigenvalues of the inner product matrix for an ultrametric distance. Principal coordinate analysis on an ultrametric distance gives two classes of independent coordinates, describing...
En classification conceptuelle d'un ensemble d'objets décrits dans un espace de représentation, on cherche à construire une partition des objets en classes disjointes et simultanément une caractérisation de chaque classe dans les termes de l'espace de représentation. Dans le cas, très courant, où cet espace est engendré par des données binaires nous présentons deux algorithmes, dérivés des méthodes ascendantes et descendantes en classification qui maximisent localement un indice de cohésion des...
The paper gives a new interpretation and a possible optimization of the well-known -means algorithm for searching for a locally optimal partition of the set which consists of disjoint nonempty subsets , . For this purpose, a new divided -means algorithm was constructed as a limit case of the known smoothed -means algorithm. It is shown that the algorithm constructed in this way coincides with the -means algorithm if during the iterative procedure no data points appear in the Voronoi diagram....
L'implication statistique, selon R.Gras, permet d'associer à un ensemble de variables binaires ou fréquentielles un préordre représentable par un graphe non symétrique et par une hiérarchie ascendante. L'analyse d'un questionnaire à modalités totalement ordonnées nous contraint, pour conserver l'information maximale, à étendre cette notion à des variables modales et, par suite et a fortiori, à des variables ordinales qui s'y ramènent. A la suite de cette construction, on examine les contributions...
Currently displaying 1 –
20 of
29