Il presente contributo si propone di condividere le finalità, la metodologia di sviluppo e gli esiti delle prime ricerche condotte sul corpus PAISÀ, un corpus di testi in italiano contemporaneo scaricati dal web, ideato con finalità glottodidattiche e di ricerca nell'ambito del progetto omonimo. Presenteremo come il progetto si inserisce nel panorama, sempre più vasto, dei web-derived corpora, gli accorgimenti che sono risultati necessari in fase di creazione per evitare la spinosa questione del copyright e le ripercussioni che ciò ha avuto sui contenuti. Ci concentreremo poi sui diversi livelli di annotazione che arricchiscono il corpus PAISÀ, soffermandoci in particolare sullo sforzo di classificazione dei testi per argomento, intenzione comunicativa e genere testuale, tre parametri che, una volta trasformati in criteri di ricerca e esplorazione del corpus, permetteranno agli utenti - insegnanti di lingua in primis - una consultazione estremamente mirata e raffinata dei testi.

I testi del web: una proposta di classificazione sulla base del corpus PAISÀ

CASTAGNOLI, SARA;
2011

Abstract

Il presente contributo si propone di condividere le finalità, la metodologia di sviluppo e gli esiti delle prime ricerche condotte sul corpus PAISÀ, un corpus di testi in italiano contemporaneo scaricati dal web, ideato con finalità glottodidattiche e di ricerca nell'ambito del progetto omonimo. Presenteremo come il progetto si inserisce nel panorama, sempre più vasto, dei web-derived corpora, gli accorgimenti che sono risultati necessari in fase di creazione per evitare la spinosa questione del copyright e le ripercussioni che ciò ha avuto sui contenuti. Ci concentreremo poi sui diversi livelli di annotazione che arricchiscono il corpus PAISÀ, soffermandoci in particolare sullo sforzo di classificazione dei testi per argomento, intenzione comunicativa e genere testuale, tre parametri che, una volta trasformati in criteri di ricerca e esplorazione del corpus, permetteranno agli utenti - insegnanti di lingua in primis - una consultazione estremamente mirata e raffinata dei testi.
File in questo prodotto:
File Dimensione Formato  
Borghetti_Castagnoli_ Brunello_2011_PAISA.pdf

non disponibili

Tipologia: Documento in post-print (versione successiva alla peer review e accettata per la pubblicazione)
Licenza: DRM non definito
Dimensione 255.97 kB
Formato Adobe PDF
255.97 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento:
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact