Lo scopo della mia ricerca è essenzialmente incentrato sullo studio e la progettazione di una interfaccia dialogante, un programma per computer capace di simulare, in un semplice dialogo, le caratteristiche del linguaggio naturale umano. Nell’affrontare questo lavoro, dal momento che la realizzazione di una simile interfaccia, presuppone implicitamente, una conoscenza approfondita di tutti i molteplici aspetti del linguaggio, dalla fonologia, alla morfologia, alla sintassi, alla semantica, e naturalmente alla pragmatica, ho cercato di approfondire tali tematiche dal punto di vista computazionale. Il primo capitolo della mia trattazione presenta, a scopo introduttivo, alcuni riferimenti terminologici e soprattutto storici: vengono descritte le prime applicazioni informatiche in ambito linguistico, e i più moderni esempi di programmi di interfaccia, di traduzione, di recupero informazioni e generazione testuale. Il secondo capitolo è invece una panoramica sull’attività di Text Preprocessing, quell’attività necessaria allo scopo di “preparare” e strutturare, tramite opportune applicazioni, la risorsa testuale per una successiva elaborazione. In riferimento all’aspetto pratico della ricerca, i vari programmi presentati sono sviluppati in Visual C++, ma definiti in modo tale da essere facilmente trasportabili in altri linguaggi (ad esempio Java, oppure C# con cui ho realizzato l’applicazione ASP.NET che rende disponibile il chatbot in rete). Dopo la definizione di fondamentali problematiche di preprocessing, il capitolo successivo è incentrato sulle attività di Information Retrieval ed Extraction, attività che fanno parte di quel settore della linguistica computazionale dedicato al recupero di informazioni significative all’interno dei testi. Le applicazioni di Information Retrieval e Information Extraction cercano cioè di contribuire, alla gestione della sovrabbondanza di dati presenti oggigiorno in forma digitale e di risolvere, in parte, le problematiche prodotte da tale sovrabbondanza. L’Information Retrieval consiste nell’attività di individuare, a partire da una specifica richiesta informativa e da un insieme di documenti messi a disposizione, un sottoinsieme di questi ultimi in cui l’informazione richiesta è o può essere presente. L’Information Extraction si propone invece di ricercare all’interno di uno o più documenti di riferimento, determinati elementi informativi: nomi, luoghi, date, ma anche eventi, concetti, relazioni. Nel quarto capitolo, incentrato sulla teoria del Discorso, il linguaggio è inteso come fenomeno che non solo opera a livello di parole o frasi, ma anche a un livello superiore dove i suoi singoli elementi, costituiscono un insieme correlato e una sorta di struttura. Il quinto capitolo sulla Generazione Testuale (Natural Language Generation o NLG) è impostato a partire da queste considerazioni e tratta in modo più dettagliato la problematica specifica della produzione di testi in modo automatico a opera di un computer. La generazione del linguaggio naturale è il procedimento mediante il quale i tratti del nostro pensiero sono resi nella forma di un linguaggio scritto o parlato. Il “generatore” (l’equivalente di una persona con qualcosa da dire) risulta nel nostro caso un computer o meglio un programma per computer, il cui lavoro inizia con l’intenzione di “comunicare” qualcosa, e si sviluppa nel determinare il contenuto di ciò che verrà detto: selezionare la lingua, le parole e l’organizzazione retorica di queste ultime, allo scopo di produrre un testo più o meno esteso. A questo punto, nella seconda parte della ricerca il tema principale è incentrato sulla progettazione vera e propria di una interfaccia dialogante. Il linguaggio è in grado di conferire prerogative umane a chi ne possiede il dono, e soprattutto la conversazione, il dialogo costituiscono, in ultima analisi la manifestazione più evidente e privilegiata dagli esseri umani per esprimere questa sorta di facoltà. Il primo approccio che noi tutti abbiamo con il linguaggio avviene proprio tramite una serie più o meno articolata ed evoluta di conversazioni, e la maggior parte degli esseri umani, in molteplici attività della nostra esistenza, attraverso il dialogo e la conversazione, interagiscono col mondo circostante. Nel sesto capitolo analizzo in dettaglio alcuni dei principali aspetti che concernono l’attuazione di un dialogo tra due agenti, e le sue caratteristiche principali. Nel settimo, invece, definisco alcune delle strategie attualmente utilizzate per realizzare una effettiva interfaccia dialogante. Descrivo le varie proposte presenti nell’attuale panorama tecnologico e le varie esperienze compiute nel corso degli anni in quest’ambito di studi (i vari chatbot ELIZA, PARRY, SHRDLU ecc.) Il capitolo seguente è dedicato alle caratteristiche specifiche della mia interfaccia e ai principali algoritmi da me utilizzati e programmati a scopo di esempio. La conclusione della ricerca è imperniata nella descrizione delle varie prospettive offerte dall’utilizzo di interfacce dialoganti sempre più efficienti e sulle eventuali possibilità di una loro concreta realizzazione. Cerco quindi, di chiarire ulteriormente le correnti più significative dell’Intelligenza Artificiale legate all’aspetto prettamente linguistico, nella prospettiva in cui la semplice competenza nell’uso del linguaggio umano corrisponde alla definizione medesima di una forma di Intelligenza. Nella parte finale, naturalmente, è definita una vasta bibliografia riguardante le più disparate teorie e applicazioni pratiche nell’ambito della linguistica computazionale: dai primi pioneristici studi negli anni cinquanta (per lo più legati, in clima di guerra fredda, al problema della traduzione di un testo) fino ai nostri giorni, cioè all’attuale tentativo di concretizzare una più umana interazione con la macchina, proprio attraverso il linguaggio naturale, nella prospettiva sempre più concreta di nuove applicazioni in grado di coesistere con i moderni sviluppi della scienza robotica.

Chatbot e Interfacce Dialoganti: la nuova frontiera

SGARIGLIA, Andrea
2014-01-01

Abstract

Lo scopo della mia ricerca è essenzialmente incentrato sullo studio e la progettazione di una interfaccia dialogante, un programma per computer capace di simulare, in un semplice dialogo, le caratteristiche del linguaggio naturale umano. Nell’affrontare questo lavoro, dal momento che la realizzazione di una simile interfaccia, presuppone implicitamente, una conoscenza approfondita di tutti i molteplici aspetti del linguaggio, dalla fonologia, alla morfologia, alla sintassi, alla semantica, e naturalmente alla pragmatica, ho cercato di approfondire tali tematiche dal punto di vista computazionale. Il primo capitolo della mia trattazione presenta, a scopo introduttivo, alcuni riferimenti terminologici e soprattutto storici: vengono descritte le prime applicazioni informatiche in ambito linguistico, e i più moderni esempi di programmi di interfaccia, di traduzione, di recupero informazioni e generazione testuale. Il secondo capitolo è invece una panoramica sull’attività di Text Preprocessing, quell’attività necessaria allo scopo di “preparare” e strutturare, tramite opportune applicazioni, la risorsa testuale per una successiva elaborazione. In riferimento all’aspetto pratico della ricerca, i vari programmi presentati sono sviluppati in Visual C++, ma definiti in modo tale da essere facilmente trasportabili in altri linguaggi (ad esempio Java, oppure C# con cui ho realizzato l’applicazione ASP.NET che rende disponibile il chatbot in rete). Dopo la definizione di fondamentali problematiche di preprocessing, il capitolo successivo è incentrato sulle attività di Information Retrieval ed Extraction, attività che fanno parte di quel settore della linguistica computazionale dedicato al recupero di informazioni significative all’interno dei testi. Le applicazioni di Information Retrieval e Information Extraction cercano cioè di contribuire, alla gestione della sovrabbondanza di dati presenti oggigiorno in forma digitale e di risolvere, in parte, le problematiche prodotte da tale sovrabbondanza. L’Information Retrieval consiste nell’attività di individuare, a partire da una specifica richiesta informativa e da un insieme di documenti messi a disposizione, un sottoinsieme di questi ultimi in cui l’informazione richiesta è o può essere presente. L’Information Extraction si propone invece di ricercare all’interno di uno o più documenti di riferimento, determinati elementi informativi: nomi, luoghi, date, ma anche eventi, concetti, relazioni. Nel quarto capitolo, incentrato sulla teoria del Discorso, il linguaggio è inteso come fenomeno che non solo opera a livello di parole o frasi, ma anche a un livello superiore dove i suoi singoli elementi, costituiscono un insieme correlato e una sorta di struttura. Il quinto capitolo sulla Generazione Testuale (Natural Language Generation o NLG) è impostato a partire da queste considerazioni e tratta in modo più dettagliato la problematica specifica della produzione di testi in modo automatico a opera di un computer. La generazione del linguaggio naturale è il procedimento mediante il quale i tratti del nostro pensiero sono resi nella forma di un linguaggio scritto o parlato. Il “generatore” (l’equivalente di una persona con qualcosa da dire) risulta nel nostro caso un computer o meglio un programma per computer, il cui lavoro inizia con l’intenzione di “comunicare” qualcosa, e si sviluppa nel determinare il contenuto di ciò che verrà detto: selezionare la lingua, le parole e l’organizzazione retorica di queste ultime, allo scopo di produrre un testo più o meno esteso. A questo punto, nella seconda parte della ricerca il tema principale è incentrato sulla progettazione vera e propria di una interfaccia dialogante. Il linguaggio è in grado di conferire prerogative umane a chi ne possiede il dono, e soprattutto la conversazione, il dialogo costituiscono, in ultima analisi la manifestazione più evidente e privilegiata dagli esseri umani per esprimere questa sorta di facoltà. Il primo approccio che noi tutti abbiamo con il linguaggio avviene proprio tramite una serie più o meno articolata ed evoluta di conversazioni, e la maggior parte degli esseri umani, in molteplici attività della nostra esistenza, attraverso il dialogo e la conversazione, interagiscono col mondo circostante. Nel sesto capitolo analizzo in dettaglio alcuni dei principali aspetti che concernono l’attuazione di un dialogo tra due agenti, e le sue caratteristiche principali. Nel settimo, invece, definisco alcune delle strategie attualmente utilizzate per realizzare una effettiva interfaccia dialogante. Descrivo le varie proposte presenti nell’attuale panorama tecnologico e le varie esperienze compiute nel corso degli anni in quest’ambito di studi (i vari chatbot ELIZA, PARRY, SHRDLU ecc.) Il capitolo seguente è dedicato alle caratteristiche specifiche della mia interfaccia e ai principali algoritmi da me utilizzati e programmati a scopo di esempio. La conclusione della ricerca è imperniata nella descrizione delle varie prospettive offerte dall’utilizzo di interfacce dialoganti sempre più efficienti e sulle eventuali possibilità di una loro concreta realizzazione. Cerco quindi, di chiarire ulteriormente le correnti più significative dell’Intelligenza Artificiale legate all’aspetto prettamente linguistico, nella prospettiva in cui la semplice competenza nell’uso del linguaggio umano corrisponde alla definizione medesima di una forma di Intelligenza. Nella parte finale, naturalmente, è definita una vasta bibliografia riguardante le più disparate teorie e applicazioni pratiche nell’ambito della linguistica computazionale: dai primi pioneristici studi negli anni cinquanta (per lo più legati, in clima di guerra fredda, al problema della traduzione di un testo) fino ai nostri giorni, cioè all’attuale tentativo di concretizzare una più umana interazione con la macchina, proprio attraverso il linguaggio naturale, nella prospettiva sempre più concreta di nuove applicazioni in grado di coesistere con i moderni sviluppi della scienza robotica.
File in questo prodotto:
File Dimensione Formato  
Dissertazione.AS.2.pdf

accesso aperto

Tipologia: Altro materiale allegato (es. Copertina, Indice, Materiale supplementare, Abstract, Brevetti Spin-off, Start-up etc.)
Licenza: DRM non definito
Dimensione 6.01 MB
Formato Adobe PDF
6.01 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11393/192681
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact