L'attribuzione dei testi gramsciani: metodi e modelli matematici

Chiara Basile; Dario Benedetto; Emanuele Caglioti; Mirko Degli Esposti

La Matematica nella Società e nella Cultura. Rivista dell'Unione Matematica Italiana (2010)

  • Volume: 3, Issue: 2, page 235-269
  • ISSN: 1972-7356

Abstract

top
In this paper we discuss a mathematical approach to authorship attribution we have developed in view of the new "Edizione Nazionale degli scritti di Antonio Gramsci". The techniques we use are based on some important ideas of modern mathematics, which provide interesting perspectives on the analysis of texts.

How to cite

top

Basile, Chiara, et al. "L'attribuzione dei testi gramsciani: metodi e modelli matematici." La Matematica nella Società e nella Cultura. Rivista dell'Unione Matematica Italiana 3.2 (2010): 235-269. <http://eudml.org/doc/290695>.

@article{Basile2010,
abstract = {In questo lavoro illustriamo un metodo matematico per affrontare iproblemi di attribuzione di autore, sviluppato in vista della nuova "Edizione Nazionale degli scritti di Antonio Gramsci". Il metodo è basato su alcune importanti idee della matematica moderna, che offrono interessanti prospettive nell'analisi dei testi.},
author = {Basile, Chiara, Benedetto, Dario, Caglioti, Emanuele, Degli Esposti, Mirko},
journal = {La Matematica nella Società e nella Cultura. Rivista dell'Unione Matematica Italiana},
language = {ita},
month = {8},
number = {2},
pages = {235-269},
publisher = {Unione Matematica Italiana},
title = {L'attribuzione dei testi gramsciani: metodi e modelli matematici},
url = {http://eudml.org/doc/290695},
volume = {3},
year = {2010},
}

TY - JOUR
AU - Basile, Chiara
AU - Benedetto, Dario
AU - Caglioti, Emanuele
AU - Degli Esposti, Mirko
TI - L'attribuzione dei testi gramsciani: metodi e modelli matematici
JO - La Matematica nella Società e nella Cultura. Rivista dell'Unione Matematica Italiana
DA - 2010/8//
PB - Unione Matematica Italiana
VL - 3
IS - 2
SP - 235
EP - 269
AB - In questo lavoro illustriamo un metodo matematico per affrontare iproblemi di attribuzione di autore, sviluppato in vista della nuova "Edizione Nazionale degli scritti di Antonio Gramsci". Il metodo è basato su alcune importanti idee della matematica moderna, che offrono interessanti prospettive nell'analisi dei testi.
LA - ita
UR - http://eudml.org/doc/290695
ER -

References

top
  1. BASILE, C. - BENEDETTO, D. - CAGLIOTI, E. - DEGLI ESPOSTI, M., An example of mathematical authorship attribution, Journal of Mathematical Physics, 49, 1-20 (2008). Zbl1159.81302MR2484342DOI10.1063/1.2996507
  2. BENEDETTO, D. - CAGLIOTI, E. - LORETO, V., Language Trees and Zipping, Phys. Rev. Lett.88, n. 4, 048702-1, 048702-4 (2002). 
  3. BENNETT, W. R., Scientific and engineering problem-solving with the computer, Prentice-Hall, Inc.Englewood Cliffs, New Jersey (1976). 
  4. CAVALLI-SFORZA, L. L. - MENOZZI, P. - PIAZZA, A., Storia e geografia dei geni umani, Milano, Adelphi2000. 
  5. CLEMENT, R. - SHARP, D., Ngram and Bayesian Classification of Documents for Topic and Authorship, Lit. Ling. Comp.18, n. 4 423 (2003). 
  6. DE MORGAN, A., in Memoirs of Augustus de Morgan by his wife Sophia Elizabeth de Morgan with Selections from his Letters, (Longman's Green and Co., London, 1851/1882). 
  7. GRASSBERGER, P., Data compression and entropy estimates by non-sequential recursive pair substitution, ArXiv:physics/0207023 
  8. GRIEVE, J. W., Quantitative Authorship Attribution: a History and an Evaluation of Techniques. http://hdl.handle.net/1892/2055, Lit. Ling. Comp.22, 251 (2007). 
  9. JUOLA, P., Cross-entropy and linguistic typology, Proceeding of New Methods in Language Processing 3, Sidney, 1998. 
  10. JUOLA, P., Authorship Attribution, Foundations and Trends in Information Retrieval, vol. 1, no. 3, 233-334 (2006). 
  11. KHMELEV, D. V. - KUKUSHKINA, O. V. - POLIKARPOV, A. A. - KHMELEV, D. V., Using literal and grammatical statistics for authorship attribution, Problemy Peredachi Informatsii, 37 (2), 2000, pagg. 96-108, translated in English in Problems of Information Transmission, 37 (2001) 172-184. Zbl1008.62118MR2099901DOI10.1023/A:1010478226705
  12. KESELJ, V. - PENG, F. - CERCONE, N. - THOMAS, C., N-gram-based Author Profiles for Authorship Attribution, Proceedings of the Conference Pacific Association for Computational Linguistics, PACLING'03, Dalhousie University, Halifax, Nova Scotia, Canada, August 2003, pagg. 255-264. 
  13. KESELJ, V. - CERCONE, N., CNG Method with Weighted Voting Ad-hoc Authorship Attribution Competition(AAAC), June 2004. Part of ALLC/ACH 2004 conference. 
  14. KHMELEV, D. V. - TWEEDIE, F. J., Using Markov Chains for Identification of Writers, Lit. Ling. Comp.16, 3: 299-307 (2001). 
  15. MARKOV, A. A., Primer statisticheskogo issledovanija nad tekstom "Evgenija Onegina" illjustrirujuschij svjaz' ispytanij v tsep. (An example of statistical study on the text of "Eugene Onegin" illustrating the linking of events to a chain.), Izvestija Imp. Akademii naukVI, 153-162 (1913). 
  16. MARKOV, A. A., Ob odnom primeneni statisticheskogo metoda. (On some application of statistical method), Izvestija Imp. Akademii nauk serijaVI, 4: 239-42 (1916). 
  17. MENDENHALL, T. C., The characteristic curves of composition, Science, vol. IX, 237-249 (1887). 
  18. PIERCE, J. R., La Teoria dell'Informazione, Milano, Mondadori, 1963. 
  19. PUGLISI, A. - BENEDETTO, D. - CAGLIOTI, E. - LORETO, V. - VULPIANI, A., Data compression and learning in time sequences analysis, Phys. D180, no. 1-2, 92-107 (2003). Zbl1094.68567MR1984306DOI10.1016/S0167-2789(03)00047-2
  20. SHANNON, C. E., A Mathematical Theory of Communication, The Bell System Technical Journal27, 1948, p. 623. MR26286DOI10.1002/j.1538-7305.1948.tb01338.x
  21. TEAHAN, W. J., Text classification and segmentation using minimum cross-entropy, Proceedings of the International Conference on Content-based Multimedia Information Access (RIAO 2000), pages 943-961. C.I.D.-C.A.S.I.S, Paris, 2000. 
  22. WITTEN, I. H. - MOFFAT, A. - BELL, T. C., Managing Gigabytes, second edition, Morgan Kaufmann Publishers, 1999. 
  23. WYNER, A. D., Typical sequences and all that: Entropy, Pattern Matching and Data Compression, 1994 Shannon Lecture, IEEE Information Theory Society Newsletter, July 1995. 
  24. ZIV, J. - LEMPEL, A., A universal algorithm for sequential data compression, IEEE Transactions on Information Theory, IT-23 no. 3, pagg. 337-343 (1977). Zbl0379.94010MR530215DOI10.1109/tit.1977.1055714
  25. ZIV, J. - MERHAV, N., A measure of relative entropy between individual sequences with application to universal classification, IEEE Transactions of Information Theory, 39 (4), 1993, pagg. 1270-1279. Zbl0801.94004MR1267157DOI10.1109/18.243444

NotesEmbed ?

top

You must be logged in to post comments.

To embed these notes on your page include the following JavaScript code on your page where you want the notes to appear.

Only the controls for the widget will be shown in your chosen language. Notes will be shown in their authored language.

Tells the widget how many notes to show per page. You can cycle through additional notes using the next and previous controls.

    
                

Note: Best practice suggests putting the JavaScript code just before the closing </body> tag.