martes, 9 de junio de 2015

ANÀLISI LEXICOMÈTRIC (III) - PRIMER ANÀLISI

Els quatre posts objecte d'anàlisi són els següents:

Post 1:    Building Stories, de Chris Ware.

Post 2  'Fabricar historias', la obra maestra de Chris Ware

Post 3:   Construyendo historias por Chris Ware

Post 4:   Fabricar historias, un cómic de Chris Ware que nos trae Random House Mondadori

Un cop adjuntat el corpus, el principal és saber totes les paraules que hi ha dins d'ell per a poder començar l'anàlisi lexicomètric. Abans però s'ha realitzat un doble filtratge.


  • S'ha elaborat una llista de paraules gramaticals, stopword list, amb articles definits, indefinits, adverbis, conjuncions, etc. que s'exclouran perquè el que es preten és analitzar les paraules amb significat gramatical. Així mateix, al introduir la llista de stopwords, també hi podem indicar l'opció de treat all data as lowercase de manera que el programa no discrimini segons majúscules o minúscules. Amb aquesta opció totes les paraules tindran la mateixa consideració alhora de calcular la seva freqüència.
  • S'ha lematitzat el corpus. Mitjançant aquest procés, pel càlcul de freqüències, es conten totes les varietats morfològiques d'una paraula, com una mateixa paraula.

Com a resultat s'ha obtingut els llistats Word List, de les freqüències corresponents a cada post tenint en compte la stopword list i la lematització:


                                                             Word List Post 1

                                                             Word List Post 2

                                                             Word List Post 3

                                                             Word List Post 4





No hay comentarios:

Publicar un comentario