Étude statistique des données collectées par l’observatoire national des maladies du bois de la vigne

Frédéric Bertrand; Myriam Maumy; Lionel Fussler; Nathalie Kobes; Serge Savary; Jacques Grosman

Journal de la société française de statistique (2008)

  • Volume: 149, Issue: 4, page 73-106
  • ISSN: 1962-5197

Abstract

top
The Grapevine Wood Diseases National Observatory yields a cohesive, large and complex data set which may be dealt with using different approaches, as it is composed of time-varying quantitative and qualitative variables. The objective was to produce the largest possible amount of information from this data set, in order to highlight main trends. To this aim, we used both descriptive and inferential techniques. First, relationships between the different variables are identified using factorial methods, namely multiple correspondence analysis, principal component analysis and factor analysis of mixed data. Then, logistic regressions were used to specify the relationships we highlighted; confidence intervals for the parameters were constructed using bootstrap techniques. Lastly, we used factorial analysis of multi-tables in order to account for the successive three years of data.

How to cite

top

Bertrand, Frédéric, et al. "Étude statistique des données collectées par l’observatoire national des maladies du bois de la vigne." Journal de la société française de statistique 149.4 (2008): 73-106. <http://eudml.org/doc/93489>.

@article{Bertrand2008,
abstract = {L’objectif de l’Observatoire National des Maladies du Bois de la Vigne est de dresser un état des lieux de la répartition, de la fréquence et de l’intensité de l’expression des symptômes foliaires des maladies du bois, pour répondre à la question de leur progression dans le vignoble français. En effet, suite à une interdiction de l’utilisation de l’arsénite de soude, les viticulteurs ne disposent plus d’aucune méthode de lutte chimique curative homologuée contre les maladies du bois de la vigne. Cet observatoire collecte, chaque année, depuis 2003, un ensemble de données cohérentes. Le jeu de données est complexe : il comporte des variables quantitatives et qualitatives qui évoluent au cours du temps. La problématique de l’étude est de dégager les grandes tendances en matière d’épidémiologie végétale afin de déterminer quelles sont les mesures prophylactiques à mettre en œuvre collectivement et à grande échelle. Le travail statistique s’est articulé en trois points. Nous avons mis en évidence des relations entre les différentes variables de l’étude, puis nous avons utilisé l’analyse des correspondances multiples, l’analyse en composantes principales et l’analyse factorielle de données mixtes. Puis, afin de préciser les relations décelées, notre choix s’est porté sur des modèles de régressions logistiques. Nous avons utilisé des techniques bootstrap pour construire des intervalles de confiance autour de leurs paramètres. Enfin, pour tenir compte du facteur temps, nous avons employé des méthodes d’analyse factorielle de tableaux multiples.},
author = {Bertrand, Frédéric, Maumy, Myriam, Fussler, Lionel, Kobes, Nathalie, Savary, Serge, Grosman, Jacques},
journal = {Journal de la société française de statistique},
keywords = {multiple correspondence analysis; principal component analysis; factor analysis of mixed data; binary logistic regression; ordinal logistic regression; bootstrap; factor analysis of multi-tables},
language = {fre},
number = {4},
pages = {73-106},
publisher = {Société française de statistique},
title = {Étude statistique des données collectées par l’observatoire national des maladies du bois de la vigne},
url = {http://eudml.org/doc/93489},
volume = {149},
year = {2008},
}

TY - JOUR
AU - Bertrand, Frédéric
AU - Maumy, Myriam
AU - Fussler, Lionel
AU - Kobes, Nathalie
AU - Savary, Serge
AU - Grosman, Jacques
TI - Étude statistique des données collectées par l’observatoire national des maladies du bois de la vigne
JO - Journal de la société française de statistique
PY - 2008
PB - Société française de statistique
VL - 149
IS - 4
SP - 73
EP - 106
AB - L’objectif de l’Observatoire National des Maladies du Bois de la Vigne est de dresser un état des lieux de la répartition, de la fréquence et de l’intensité de l’expression des symptômes foliaires des maladies du bois, pour répondre à la question de leur progression dans le vignoble français. En effet, suite à une interdiction de l’utilisation de l’arsénite de soude, les viticulteurs ne disposent plus d’aucune méthode de lutte chimique curative homologuée contre les maladies du bois de la vigne. Cet observatoire collecte, chaque année, depuis 2003, un ensemble de données cohérentes. Le jeu de données est complexe : il comporte des variables quantitatives et qualitatives qui évoluent au cours du temps. La problématique de l’étude est de dégager les grandes tendances en matière d’épidémiologie végétale afin de déterminer quelles sont les mesures prophylactiques à mettre en œuvre collectivement et à grande échelle. Le travail statistique s’est articulé en trois points. Nous avons mis en évidence des relations entre les différentes variables de l’étude, puis nous avons utilisé l’analyse des correspondances multiples, l’analyse en composantes principales et l’analyse factorielle de données mixtes. Puis, afin de préciser les relations décelées, notre choix s’est porté sur des modèles de régressions logistiques. Nous avons utilisé des techniques bootstrap pour construire des intervalles de confiance autour de leurs paramètres. Enfin, pour tenir compte du facteur temps, nous avons employé des méthodes d’analyse factorielle de tableaux multiples.
LA - fre
KW - multiple correspondence analysis; principal component analysis; factor analysis of mixed data; binary logistic regression; ordinal logistic regression; bootstrap; factor analysis of multi-tables
UR - http://eudml.org/doc/93489
ER -

References

top
  1. [1] BERTRAND F., MAUMY M., FUSSLER L., KOBES N., SAVARY S. et GROSMAN J. (2008), Étude statistique des données collectées par l’Observatoire National des Maladies du Bois de la Vigne : Annexe de tables et graphiques, disponible en version électronique. http://www-irma.u-strasbg.fr/~fbertran/recherche/Annexe_MdBVigne.pdf. 
  2. [2] CANTY A. (version originale pour S) et RIPLEY B. (adaptation en R) (2006), boot : Bootstrap R (S-Plus) Functions (Canty), R package version 1.2-27. 
  3. [3] CAZES P. (2004), Quelques méthodes d’analyse factorielle d’une série de tableaux de données. Revue MODULAD, 31, 1-31. 
  4. [4] DAVISON A.C. et HINKLEY D.V. (1997), Bootstrap Methods and their Applications. Cambridge University Press. Zbl0886.62001MR1478673
  5. [5] DRAPER N.R. et SMITH H. (1998), Applied regression analysis. 3e édition, J. Wiley, New York. Zbl0895.62073MR1614335
  6. [6] DRAY S., PETTORELLI N. et CHESSEL D. (2003), Multivariate Analysis of Incomplete Mapped Data, Transactions in GIS, 7, 411-422. 
  7. [7] ESCOFIER B. (1979), Traitement simultané de variables quantitatives et qualitatives en analyse factorielle. Les cahiers de l’analyse des données, 4 (2), 132-146. 
  8. [8] ESCOFIER B. et PAGÈS J. (1998), Analyses factorielles simples et multiples. 3e édition, Dunod, Paris. 
  9. [9] FUSSLER L. (2006), Analyse statistique de données de l’Observatoire National des Maladies du Bois, Université Louis Pasteur, Strasbourg, Mémoire de deuxième année de Master. 
  10. [10] FREEMAN G.H. et HALTON J.H. (1951), Note on an exact treatment of contingency, goodness of fit and other problems of significance. Biometrika, 38, 141-149. Zbl0044.14702MR42666
  11. [11] GOODMAN L.A. et KRUSKAL W.H. (1954), Measures of Association for Cross Classifications. Journal of the American Statistical Association, 49, 732-764. Zbl0056.12801
  12. [12] HOSMER D.W. (2000), Applied logistic regression. 2e édition, J. Wiley, New York. Zbl0967.62045
  13. [13] HUSSON F., LÊ S. et MAZET J. (2007), FactoMineR : Factor Analysis and Data Mining with R. http://factominer.free.fr, http://www.agrocampus-rennes.fr/math/. 
  14. [14] KENDALL M.G. (1938), A new measure of rank correlation. Biometrika, 30, 81-93. Zbl0019.13001
  15. [15] LAVIT Ch., ESCOUFIER Y., SABATIER R. et TRAISSAC P. (1994), The ACT (STATIS Method). Computational Statistics and Data Analysis, 18, 97-119. Zbl0825.62009MR1292337
  16. [16] PAGÈS J. (2004), Analyse factorielle de données mixtes. Rev. Statistique Appliquée, LII (4), 93-111. 
  17. [17] SAVARY S. et MADDEN L.V. (1995), Use of Categorical Information and Correspondence Analysis in Plant Disease Epidemiology, Advances in Botanical Research, 21, 213-240. 
  18. [18] SOMERS R.H. (1962), A new asymmetric measure of association for ordinal variables. American Sociological Review, 27, 799-811. 
  19. [19] R Development Core Team (2007), R : A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna. http://www.R-project.org. 

NotesEmbed ?

top

You must be logged in to post comments.

To embed these notes on your page include the following JavaScript code on your page where you want the notes to appear.

Only the controls for the widget will be shown in your chosen language. Notes will be shown in their authored language.

Tells the widget how many notes to show per page. You can cycle through additional notes using the next and previous controls.

    
                

Note: Best practice suggests putting the JavaScript code just before the closing </body> tag.