martes, 9 de junio de 2015

ANÀLISI LEXICOMÈTRIC (II) - METODOLOGIA



S'han seleccionat una sèrie d'entrades (quatre en total), on s'hi realitza una crítica o ressenya de l'obra de Ware  A continuació, s'ha traslladat el text d'aquestes entrades a l'aplicació Word i s'ha convertit el document resultant (un per blog) en un text sense format (.txt), amb la codificació UTF-8.

Aquests documents en format (.txt),  són els que s'utilitzaran tot seguit en l'aplicació AntConc.




AntConc consta d'eines i funcions específiques que permeten fer un filtratge del conjunt de textos per paraules clau (keywords), d'agrupaments lèxics (clústers) i llistats de paraules (temes) amb la seva corresponent rànquing i freqüència en el corpus textual.



S'ha utilitzat una llista de filtratge stopword (en castellà) per eliminar el soroll de determinades paraules comunes en els resultats de l'anàlisi.

També s'ha fet servir una lematització molt simple del corpus, per tal de depurar encara més el text.

Finalment, s'aplicaran sobre els documents diferentes eines i funcions d'anàlisi lexicomètrica:


Concordance. Amb aquesta eina es pot analitzar on apareix una paraula concreta en tots els contexts, i la seva intencionalitat.

Concordance Plot. Amb aquesta funció el programa  mostra les concordances de paraules individuals, d'una manera més gràfica a partir d'un codi de barres i  indica en quina posició apareixen dins del text.

Collocates. P
ermet saber quines són aquelles altres paraules, i amb quina freqüència, apareixen al costat d'una paraula analitzada. 

Clusters/N-Grams. 
Aquestes dues eines són útils per poder fer cerques més concretes permetent:
  •    amb Clusters, una llista ordenada d'agrupacions al voltant de la paraula analitzada.
  •    amb N-Grams crear grups de paraules d'una mida determinada.






No hay comentarios:

Publicar un comentario