Introduzione
Dal momento che la ragione del nostro incontro oggi è il confronto di esperienze diverse sulla tematica della certificazione delle competenze linguistiche, ho pensato che non sarei andato fuori tema sottoponendo alla vostra attenzione un testo che è anche un test di lingua inglese. Avremmo potuto usarlo sia per analizzare le vostre capacità di lettura, che per verificare l’ efficacia di questo tipo di testo per operare delle valutazioni. Quindi assieme avremmo potuto stabilire una graduatoria delle vostre abilità al fine di assegnare una votazione rigorosa alle vostre prestazioni diverse. Alla fine di questo seminario sono sicuro che gli organizzatori sarebbero stati ben contenti di rilasciarvi non solo un certificato di frequenza ma anche uno di competenza della lingua inglese garantito addirittura dalla validità di una prova oggettiva.
Ho poi pensato che uno stratagemma di questo genere avrebbe funzionato per tenere ben ferma la vostra attenzione sulle questioni di cui voglio ora parlarvi, ma non vi avrebbe probabilmente lasciato un bel ricordo di questa giornata di lavoro, dell’iniziativa del Ministero, della bella città di Bologna che ci ospita, ed ho quindi deciso di abbandonare l’idea.
Il testo che quindi vi mostro nella mia traduzione italiana è tratto da una rassegna sotto forma di articolo sullo stato dell’arte del testing linguistico, che è ancora a tutt’oggi la pubblicazione più esaustiva ed aggiornata su questa problematica scientifica. E’ stato pubblicato circa dieci anni fa dalla rivista “Language Teaching” della Cambridge University Press. Il suo autore è Peter Skhean che introduce la problematica del testing linguistico con le seguenti parole.
Non di rado si sente dire che i problemi relativi al testing linguistico potrebbero essere risolti seguendo di nascosto i nostri candidati per un certo tempo, quindi osservandone il comportamento linguistico in una vasta gamma di situazioni comunicative, in modo da arrivare a delle generalizzazioni pertinenti riguardo la loro prestazione linguistica.
Ma è anche stato obiettato che questa situazione ipotetica è innanzitutto poco pratica (Clark, 1978; Bacham, forthcoming; Shohamy & Reves, 1985: infatti un esaminatore non avrebbe mai tempo sufficiente per realizzarla); inoltre che è viziata in partenza ( perchè la presenza costante dell’ esaminatore potrebbe modificare in modo significativo il comportamento linguistico dell’esaminando);
inoltre è stato anche osservato che questo sistema d’esame non sarebbe molto etico (Spolsky, 1985; a causa dell’intrusione di un estraneo, cioè di un esaminatore nella vita quotidiana del candidato e nelle questioni riservate delle varie persone con cui quest’ ultimo comunica) è poi stato anche detto che questo tipo di esame non sarebbe molto attendibile (dal momento che non è affatto scontato che esaminatori diversi siano in grado di interpretare e di valutare i comportamenti linguistici degli esaminandi con gli stessi criteri di riferimento).
Per finire, ammesso anche che queste difficoltà venissero superate, e quindi supponendo di poter fare affidamento su osservazioni dirette e affidabili, il fatto stesso che sono state realizzate solo su un numero limitato di comportamenti, ovviamente non su tutti quelli di cui il candidato è capace, lascia irrisolto il problema di quanto questa valutazione parziale possa generalizzare giudizi attendibili, e questo è un problema assolutamente centrale nel testing linguistico.
Ed è proprio questa questione della generalizzazione che induce oggi ricercatori e i linguisti ad interrogarsi in continuazione sulla rappresentatività dei dati da raccogliere: e quest’altro è un problema di delimitazione sia della quantità che della qualità dei dati stessi.
In altre parole ci si chiede quale campionatura di dati sia mai quella da cui sarebbe effettivamente possibile generalizzare le capacità di uso della lingua straniera da parte del candidato.
Così scriveva a proposito del testing linguistico Peter Skhean nel gennaio 1989. Da questa sintesi molto anglosassone per il modo minimalista, quasi pedestre, in cui viene riassunta la problematica scientifica del testing delle lingue straniere, vorrei passare ad analizzare un’altra citazione che mi pare significativa nel contesto di questo seminario. Ma prima di considerare quest’altra citazione è giusto fare una veloce constatazione sul primo brano. Sia il suo autore, Peter Skehan, sia gli altri nomi citati nel testo sono quelli di linguisti britannici e americani – e questo è un fatto per certi versi paradossale, proprio perchè sembrerebbe che la ricerca linguistica oggi tenda ad essere più attiva proprio in quei paesi dove le motivazioni e le capacità di apprendimento delle lingue straniere sono di gran lunga inferiori rispetto quelle che abbiamo imparato ad osservare in altri paesi.
Guardiamo ora un’ altra citazione che mi pare riassuma bene l’impatto del contesto Europeo, o meglio della recente integrazione Europea sul testing linguistico, soprattutto in questo ultimo decennio. L’autore di quest’altro brano è John Trim, anche lui inglese, che molti di voi conosceranno almeno per la sua reputazione, e questo suo testo è infatti tratt dall’introduzione al progetto delle Lingue Moderne del Consiglio d’Europa, di cui lo stesso Trim è stato direttore fin dai lontani anni settanta. La traduzione del testo è ancora mia.
In un’Europa dalle molte lingue e culture, queste differenze in passato erano state delle vere e proprie barriere tra i suoi popoli. Oggi tutte le dichiarazioni dei governi europei sono d’accordo nell’affermare che queste nostre differenze non devono più creare nuove barriere ma dovranno piuttosto risolversi in una vera e propria ricchezza per la nostra civiltà.
Bisognerà quindi fare in modo che la nostra immensa eredità di lingue e culture diverse sia salvaguardata e non venga invece eliminata. L’apprendimento delle lingue in Europa dovrà quindi imporsi come una priorità assoluta per tutti noi Europei in qualsiasi paese d’Europa viviamo.
Per raggiungere questo fine quando apprendiamo o quando insegnamo una lingua straniera è assolutamente necessario che impariamo ad usare un repertorio comune sia di termini tecnici che di criteri di riferimento. Questo ci aiuterà a fare in modo che quando ci troveremo assieme a parlare di lingue e di apprendimento linguistico saremo capaci di capirci tra noi, di farci capire dai nostri colleghi ovunque essi siano in Europa, proprio perchè possano essere in grado di seguire quello cui ci riferiamo e quello che vogliamo dire.
Allo scopo di descrivere l’ educazione linguistica e la sua valutazione abbiamo quindi pubblicato per opera del Comitato Educativo per la Cooperazione del Consiglio d’Europa questo comune quadro di riferimento che si intitola appunto “Modern Languages: Learning, Teaching, Assessment. A Common European Framework”.
Scientificità e professionalità
Ho riportato deliberatamente dall’ originale di questo brano il titolo in inglese del progetto Lingue Moderne del Consiglio d’Europa, che ha prodotto l’ormai conosciuto European Framework. Avrete anche notato che questo titolo contiene tre nozioni, delle quali due “learning” e “teaching” sono facilmente traducibili in italiano, mentre quella di “assessment” è assai più problematica.
Come si potrà tradurre “assessment” in italiano? Con “valutazione”, con “verifica”, o con “certificazione”? E se esiste una differenza terminologica tra questi tre termini, è una differenza di contesti d’uso, o è differenza di sostanza che deriva da concetti diversi. Accenno solo a questa questione terminologica, perchè avendo lavorato da diverso tempo con amici traduttori nel Lussemburgo e a Bruxelles proprio per cercare di risolvere questioni di traduzione multilingue nel Parlamento e nella Commissione Europea, mi pare che, come per tante altre nozioni, la lingua italiana non abbia a tutt’ oggi né una traduzione standardizzata né una distinzione chiara tra questi concetti diversi della lingua inglese: “assessment”, “ testing” e “certification” sono termini che si riferiscono ad operazioni molto diverse a proposito delle quali oggi anche in italiano non dovrebbe sussistere nessun tipo di ambiguità.
L’”assessment” significa “valutazione” nel senso più ampio del termine.
Il “testing” è la “scienza della valutazione linguistica” quando questa viene operata su un campione che è analizzato secondo procedimenti il più possibile oggettivi.
La “certification” è il “riconoscimento formale” che viene rilasciato da un’istituzione o un’agenzia che si fa carico di amministrare il processo di valutazione.
Sono naturalmente tre operazioni molto diverse e dal momento che il discorso complessivo di questo seminario è proprio sull’”assessment” vorrei concentrarmi soprattutto sulla differenza tecnica tra la seconda e la terza nozione, cioè sul problema scientifico di rendere il testing il più oggettivo possibile, e su quello programmatico di assegnare poi riconoscimenti che siano affidabili.
Innanzitutto il testing come operazione scientifica ha un suo preciso metodo di lavoro che è, come in tutte le scienze sociali, in una fase di continua revisione e aggiornamento, ma che ha comunque leggi proprie che devono essere osservate, se la valutazione linguistica che se ne vuole trarre dovrà essere il più possibile obiettiva, valida ed affidabile.
Mentre la “certification” è oggi un problema nuovo in una prospettiva europea: cioè da quando il riconoscimento delle competenze delle lingue straniere è importante non tanto per il valore loro attribuito dalle istituzioni nazionali che lo rilasciavano ( un Ministero, o un Examining Board, o una Dante Alighieri) ma piuttosto per il pubblico che ora deve imparare a leggere e capire il valore delle certificazioni fuori di casa propria.
“Fuori di casa propria” qui sta a significare nella comune casa europea, dove dal 1993 in poi , cioè dall’anno dell’integrazione degli stati membri, si esige un’alta qualità negli strumenti del testing, e sempre meno ci si fida dei diplomi rilasciati da istituzioni nazionali che sono autoreferenziali– sia che si tratti di agenzie private che di quelle statali. E’ importante capire le ragioni di questa svolta nel corso degli anni novanta. Infatti si è presto sentita l’esigenza che le certificazioni linguistiche dovessero rispondere a criteri internazionali, proprio perché le lingue straniere richiedono oggi competenze che vengono spese sempre più spesso fuori dai confini nazionali.
A partire dal 1993 si assiste in tutta Europa ad un intensificarsi delle attività di ricerca sulla valutazione delle competenze delle lingue straniere. La nuova situazione è soprattutto dettata dalla crescita della cooperazione europea che impone la necessità di stabilire chiare equivalenze tra le capacità d’uso delle lingue straniere; e resistere a questa nuova esigenza europea si sarebbe risolto per il paese che avesse deciso di non allinearsi ad un isolamento della propria lingua e cultura, oltrechè alla provincializzazione di buona parte delle proprie iniziative economiche.
Il testing linguistico e la certificazione delle competenze sono proprio all’inizio degli anni novanta i due settori di attività in cui il dibattito internazionale si fa più serrato . Si comincia a parlare della possibilità di una forma di valutazione sovranazionale garantita da una certificazione comune europea. Ma ci si rende presto conto che non basta l’autorevolezza della parola “europea” a garanzia della qualità. Inoltre diventa subito chiaro che l’Unione Europea non si potrebbe prestare a sancire attraverso una propria certificazione quello che è in effetti un problema di natura scientifica e non politica: cioè come misurare la competenza linguistica in una lingua straniera.
Inoltre l’Unione con i suoi programmi di sostegno e di collaborazione linguistica transnazionale abbraccia subito la tesi proposta dalla ricerca linguistica, che ha sempre criticato qualsiasi soluzione di esclusività, perchè è proprio la concorrenza scientifica che garantisce l’alta qualità della valutazione e il costante miglioramento degli strumenti del testing linguistico. Mentre in quei paesi dove continuano a sopravvivere situazioni di monopolio privato o statale a protezione dell’ esclusività dei test, è proprio questa rigidità burocratica che ha finito per deteriorare il prestigio delle certificazioni.
Come dunque si potrebbe definire oggi il miglior testing linguistico nel senso di un buon marchio di qualità scientifica ? Quale è cioè il modello che la ricerca linguistica contemporanea potrebbe indicare come la forma di valutazione scientificamente più corretta?
La risposta non è semplice, non solo per le questioni scientifiche identificate da Peter Skhean, molte delle quali sono rimaste ancora irrisolte; ma anche perchè la decisione di misurare dei dati anzichè degli altri – nel settore dell’educazione linguistica – è ancor oggi problema assai dibattuto nella ricerca scientifica, proprio perchè appartiene a diverse concezioni del linguaggio: e queste diverse concezioni sono a loro volta legate a differenti tradizioni culturali e scolastiche dei paesi europei che tuttora vogliono difenderle appunto perchè in questo settore i paesi sono autonomi e sovrani.
D’altra parte è anche vero che, una volta stabilito un accordo sugli scopi e sui dati che sono più significativi nella misurazione, diventa più facile restringere i margini del dissenso sia politico che scientifico. Per cui se lo scopo di una prova è quello di misurare non quello che è stato imparato in un corso, ma il vero e proprio uso della lingua, allora sarà più importante definire e descrivere in cosa consiste questo uso, piuttosto che costruire un meccanismo unico per la valutazione dei progressi dei candidati in corsi diversi.
Ricerca e discussioni rivolte a migliorare i test rendendo le prove d’esame più obiettive e i risultati più confrontabili, costituiscono ormai da alcuni anni una prassi consolidata in molti paesi, eppure in altri paesi continuano a trovare molta resistenza. Basti pensare che per la lingua inglese, la sola Gran Bretagna all’inizio degli anni 1990 era in grado di offrire una scelta di ben 12 test di lingua comune e altri 10 test per scopi speciali: alcuni erano certo più conosciuti di altri, ma tutti si fondavano su prove obiettive, e molti di questi test si sono diffusi sia in Europa che in altri continenti, con un prestigio dovuto anche al fatto che la valutazione veniva condotta al centro di tutte le operazioni, e da lì poi tutti i test venivano rinnovati con regolarità annuale. All’estremo opposto stavano invece quei paesi legati a una tradizione culturale che ancora vedeva la lingua come un fenomeno più individuale che sociale, e proprio lì i sistemi scolastici continuavano ad usare tipi di verifiche basate su criteri estremamente soggettivi.
Ancora all’inizio degli anni 1990, a gran distanza dall’inglese seguivano quindi il francese, il tedesco e l’olandese, che contavano ciascuno una sola certificazione. Quella dei test per l’olandese era controllata da una gestione centrale binazionale (Belgio ed Olanda), quella per il tedesco era gestita dal Goehte Institut in diversi paesi, e quella del DELF/DALF era progettata da un centro governativo in Francia, ma era gestita in modo decentralizzato. Altri paesi come la Spagna, l’Italia e il Portogallo, le cui lingue nazionali continuano a suscitare interesse all’estero, anche se in misura minore del francese e dell’ inglese, fin dall’inizio degli anni 1990 hanno messo a punto chi uno chi più sistemi per la certificazione della propria lingua come lingua straniera.
All’interno di questa situazione europea molto diversificata, che è ulteriormente divisa anche per l’adozione di modelli di testing linguistici svariati, proprio perché questi a loro volta riflettono diverse concezioni di cosa sia o non sia la competenza in una lingua straniera, esistono anche forme molto difformi nelle procedure della quantificazione dei voti e della organizzazione delle graduatorie dei candidati. Alcuni di voi avranno già una notevole esperienza di confronto e dibattito su queste problematiche. Tuttavia in questa mia breve panoramica non nuoce ricordare come queste variazioni nel modo di elaborare le diverse forme del testing linguistico possano incidere oggi sulla professionalità degli esami e sulla capacità degli stessi esaminatori. In questo senso credo sia utile guardare al passato e osservare le principali fasi attraverso cui è passata la valutazione linguistica.
Una prima fase è stata quella dell’approccio grammatico-letterario. In questa fase gli esaminatori accertavano la conoscenza rigorosa della grammatica, assieme all’analisi dello stile e delle variazioni letterarie degli usi della lingua . In questa prima fase storica la valutazione consisteva soprattutto in prove di traduzione e di critica letteraria e in verifiche della padronanza delle strutture della lingua.
La seconda fase è stata quella caratterizzata dall’approccio psico-linguistico, che è emerso dalla critica ai metodi della fase precedente, la quale fu messa sotto accusa perchè adottava un approccio soggettivo considerato quindi pre-scientifico. La nuova fase nasceva anche dalla crescente collaborazione tra due scienze sociali, quali la linguistica e la psicologia, e proponeva una concezione atomistica della lingua, la quale allora si riteneva desse prova della massima oggettività e quindi della scientificità dei sistemi di misurazione adottati. Questi sistemi di misurazione – allora si pensava - non potevano sbagliare, dal momento che proponevano di quantificare la padronanza della lingua che veniva scomposta in unità distinte ( i cosiddetti “discrete items”). I progressi della scienza statistica, in quegli anni in piena espansione, hanno poi contribuito moltissimo ad attribuire credibilità a questo metodo di valutazione. Mentre poi col tempo si è fatta strada tra i linguisti una convinzione molto diversa: che la competenza linguistica fosse ben altra cosa della somma totale di unità distinte, le quali molto spesso venivano presentate nei test in modo sconnesso anche perchè erano disarticolate da qualsiasi contesto d’uso.
La fase successiva è quella attuale, che si sviluppa proprio dal rifiuto dell’ipotesi atomistica e dei test ad unità distinte. E’ la fase storica che trae ispirazione dall’ approccio socio-comunicativo della linguistica attuale. In questa nuova fase si è cercato di introdurre nei test la ricostruzione del contesto reale, al fine di poter verificare quali siano le effettive capacità d’uso della lingua straniera da parte del candidato. I test tendono quindi a distinguere – nella loro costruzione - diverse abilità d’uso, perché è ormai accettato che la padronanza di una lingua è composta da abilità diverse e distinte. Molti test di oggi tendono tuttavia a ricomporre queste abilità, quando si tratta di valutare la prestazione dei candidati in circostanze reali , perché in ogni situazione che sia autenticamente comunicativa le quattro abilità interagiscono sempre tra loro.
La ricompoisizione delle quattro abilità in un test rimane tuttavia questione ancora aperta tra gli specialisti del testing linguistico. Infatti se tutti sono d’accordo nel valutare solo la prestazione - e non più a verificare la conoscenza delle strutture della lingua – rimane il dubbio se i test della vera comunicazione siano quelli per così dire “contesto-dipendenti”, cioè quelli più autentici e meno generalizzabili, o piuttosto quelli “contesto-indipendenti”, che sono quelli più generalizzabili ma anche quelli meno autentici.
Tre criteri fondamentali
La ricerca linguistica ha cercato di rispondere a queste domande mettendo a confronto soluzioni tecniche diverse e sono emersi tre approcci metodologici abbastanza diversi. Sono riportati qui a seguito con espressioni italiane che traducono le terminologie inglesi. Questi diversi approcci propongono
- oggettività contro soggettività
- validità contro affidabilità
- e il testing riferito a norme contro il testing riferito a criteri
Esaminiamo alcuni esempi che illustrano vantaggi e svantaggi di metodologie diverse. Ad esempio ipotizziamo che vengano dati come test o come prove d’esame temi di composizione così formulati:
Fare una relazione sulle proprie vacanze
Fare una relazione sulle vacanze appena trascorse in Inghilterra
Fare una relazione sulle esperienze disastrose di una vacanza appena trascorsa a Londra
Fare una relazione sui pericoli corsi durante una gita scolastica a Londra, mettendo in guardia amici e insegnanti di altre scuole che, sulla scorta della vostra esperienza,
nelle stazioni della metropolitana è assolutamente vietato fumare
non bastano due soli insegnanti-guida per un gruppo numeroso di trenta ragazzi
se un insegnante parla inglese e quell’altro solo francese, quest’ultimo non dovrà aspettarsi che molti inglesi lo capiscano
E’ chiaro che mettendo a confronto questi temi diversi, quelli che assegnano ai candidati i compiti più precisi, saranno anche quelli che riducendo la libertà della prestazione, eleverà l’attendibilità del test: cioè aumentando la confrontabilità delle risposte dei candidati ridurrà anche la soggettività dell’esaminatore. In questo caso si dirà che il test ha un coefficiente di affidabilità che è più alto di quelli che sono formulati con domande molto aperte, i quali si prestano invece a valutazioni più soggettive (e in particolare l’ 1 più del 2, il 2 più del 3 e il 3 più del 4).
Un coefficiente di affidabilità dà cioè la misura delle variazioni dei voti che uno stesso candidato otterrebbe in circostanze di amministrazione diverse, per esempio, non solo da diversi esaminatori, ma anche dallo stesso esaminatore, perchè in situazioni diverse un candidato potrebbe produrre prestazioni la cui qualità è soggetta a variazioni tanto più significative quanto più la domanda è aperta. Viceversa quanto più la domanda sarà chiusa, supponiamo che preveda un semplice “si” o un “no” in un test a scelta multipla, è chiaro che sia la prestazione del candidato sia la valutazione dell’esaminatore avranno un margine di variazione minimo se non addirittura inesistente.
In altre parole quanto più alto è il coefficiente di affidabilità tanto più basso sarà questo margine di variazione. E’ quindi chiaro che il coefficiente di affidabilità potrà variare più o meno a seconda delle abilità che il test si prefigge di misurare; ma non sarà mai possibile eliminare del tutto la cosiddetta “standard variation”, cioè questo margine di errore intrinseco che è inerente ad ogni test. Ad esempio la competenza grammaticale e la capacità di ascolto e di comprensione subiscono variazioni minime quando vengono esaminate in circostanze diverse. Mentre la scrittura ha un coefficiente di affidabilità sempre molto basso, proprio perchè l’abilità compositiva può variare molto da un momento ad un altro e per motivi tanto personali quanto esterni, cioè situazionali.
Al fine di limitare questo inconveniente, proprio perché non è mai possibile eliminarlo del tutto, le agenzie preposte al testing linguistico, si affidano all’operazione del cosiddetto “pre-testing” che fornisce con rigorosità statistica il margine d’errore, cioè la standard variation, delle valutazioni relativi alle abilità e ai tipi di prestazioni che sono per loro natura quelli meno affidabili. E’ chiaro che se si decidesse di adottare per tutte le abilità un tipo di prova a risposta multipla, il margine di errore sarebbe sempre insignificante; ma non si potrebbe dire che questo tipo di prova potrebbe essere in grado di verificare le vere capacità dell’uso comunicativo della lingua, dal momento che il rispondere a domande di questionari a scelta multipla è operazione artificiale, che non ha nulla a che fare con la competenza nell’uso effettivo di una lingua. In questo caso si dice che il test non sarà molto valido.
Con questa affermazione si può dire di essere arrivati al centro del vero dilemma del testing linguistico: un dilemma che è collocato nel mezzo di una linea ideale racchiusa tra due estremi opposti. Uno di questi estremi contiene una comunicazione più reale ma meno quantificabile, mentre l’estremo opposto si presta ad una quantificazione molto più rigorosa ed accurata, ma che in verità non rappresenta in modo realistico l’uso di una lingua straniera nella vita quotidiana.
Nella tipologia dei test esiste un’altra distinzione fondamentale che distingue tra i test che sono riferiti a norme e i test che sono riferiti a criteri.
I test riferiti a norme mettono a confronto le prestazioni di ciascun candidato con le prestazioni dell’intera popolazione dei candidati, e quindi assegnano voti lungo una gerarchia che riflette le diverse variazioni delle prestazioni individuali di candidati diversi. Viceversa nei test che sono riferiti a criteri specifici l’abilità dei candidati non viene valutata in rapporto alle variazioni delle loro prestazioni in sede d’esame, ma a seconda del livello raggiunto rispetto appunto una serie di criteri che erano stati precedentemente fissati e descritti. In altre parole i test riferiti a norme distribuiscono votazioni lungo tutto un arco che comprende bocciatura e promozione secondo una una scala delle variazioni delle prestazioni. Mentre i test riferiti a criteri promuovono e premiano tutti i candidati che hanno dimostrato di saper usare la lingua per gli scopi che erano stati precedentemente definiti dal programma di esame, cioè dal cosiddetto syllabus, e boccia quanti invece non sono riusciti a raggiungere quel livello.
Anche questa differenza è sostanziale ed è importante capire bene quali possono essere le conseguenze educative di questi due approcci opposti. Non a caso viene usato il termine “syllabus” per i test riferiti a criteri prestabiliti, i quali ovviamente stimolano un programma di preparazione trasparente e dettagliato, che va tutto a vantaggio degli insegnanti così come degli allievi. Questo vantaggio consiste nell’effetto benefico del cosiddetto “backwash”, cioè in quel contraccolpo estremamente positivo che questo tipo di esame può creare sulla didattica di classe. Quindi tanto più valido e comunicativo è un certo tipo di test, tanto più positivo sarà il suo effetto sulle attività di insegnamento e di apprendimento che verranno dedicate alla preparazione del syllabus stesso.
Viceversa un caso di contraccolpo negativo esisterà quando l’esame richiede preparazione e conoscenze che hanno poco a che fare con la vera capacità d’uso della lingua richiesta: come ad esempio quelle prove di grammatica utilizzate con studenti stranieri che devono dimostrare di saper usare la lingua per uno scopo molto specifico come poter seguire un corso universitario.
Infine l’efficienza dell’ amministrazione dei test è indispensabile al fine di garantire la realizzazione delle qualità di attendibilità e di validità. L’efficienza amministrativa riguarda le attività più disparate: dal controllo rigoroso delle caratteristiche della validità e della affidabilità delle prove, alla formazione degli esaminatori, dall’amministrazione puntuale delle prove alla garanzia di una seria correzione. Si tratta di attività che sono dispendiose in termini di tempo e di denaro, ma che contribuiscono alla serietà e quindi al prestigio professionale delle certificazioni che rilasciano, e quindi al volume del loro business in un clima di libera concorrenza internazionale. Certo è che l’ efficienza amministrativa e il prestigio internazionale non sono i soli indicatori della professionalità di una certificazione. Le questioni scientifiche i cui vantaggi e svantaggi sono stati appena illustrati devono aver trovato una risposta soddisfacente al di là del nome e della reputazione – cioè del marchio di fabbrica - delle organizzazioni che producono le prove d’esame e che rilasciano le relative certificazioni.
Tre progetti di testing significativi
A chiusura di questa rassegna vorrei esemplificare le diverse difficoltà e le diverse soluzioni di maggiore o minore soddisfazione, avanzate da tre importanti organizzazioni che hanno cercato di integrare il testing linguistico nel contesto europeo in questi decennio che si è appena concluso. Si è parlato di soluzioni di maggiore o minore soddisfazione da un punto di vista scientifico, e in questa mia rassegna conclusiva propongo di analizzare la certificazione che era partita dalle migliori intenzioni, ma nonostante queste non è riuscita a far prendere quota ai propri test per la complessità dell’impresa che aveva progettato e per i costi delle operazioni per realizzarla.
Questa impresa molto ambiziosa è stata quella è stata dell’International Certificate of Attainment in Modern Languages, un consorzio di istituti universitari europei specializzati nell’insegnamento della propria lingua nazionale come lingua straniera, che hanno cercato di superare le diverse tradizioni nazionali per arrivare ad una unica certificazione europea, basata su una comune architettura di scale di livelli, di criteri di verifica, di syllabuses e di prove di valutazione. Dopo ben tre anni spesi per armonizzare le differenze degli approcci nazionali che erano ben affermate in sette paesi diversi, e dopo altri due anni passati a stabilire l’equilibrio ritenuto più adatto tra validità e affidabilità, attraverso la messa a punto di prove oggettive con criteri ben differenziati e ben descritti nei syllabuses dei diversi livelli di competenza, questo progetto ambizioso, che era stato finanziato dall’Unione Europea, ha dovuto chiudere per una circostanza difficilmente prevedibile.
La ragione fu quella che le attività periodiche di validazione dei test, di pre-testing e di correzione delle prove multilingui, se dovevano venire fatte periodicamente per ogni sessione d’esami con tutti i carismi della serietà professionale che potevano garantire l’efficienza che era stata descritta e promessa al pubblico richiedevano un budget che era molto al di sopra di quello che le sette università avrebbero potuto permettersi una volta esauriti i finanziamenti europei che avevano pagato la fase sperimentale del progetto. Come dire che per garantire l’efficienza e la serietà del testing e della relativa certificazione questo consorzio di università europee avrebbe dovuto in futuro lavorare in perdita.
La seconda esperienza è quella dell’International Baccalaureate, che è conosciuto in Italia anche come Baccalaureato Internazionale. Questa organizzazione fissa i suoi programmi di studio (i cosiddetti “teaching syllabuses”), poi prepara prove d’ esame sia per le scuole private internazionali sia per le scuole pubbliche nazionali che lo richiedono. Il Baccalaureato Internazionale in realtà stabilisce prove dàesame per tutte le materie scolastiche, ma sono proprio le prove di lingua che risultano essere molto interessanti da un punto di vista scientifico. Tali prove si chiamano ancora oggi esami di Lingua A e di Lingua B , una terminologia che non adotta la nozione scientifica convenzionale di madrelingua per la Lingua A, e di lingua straniera per la lingua B, e questa è dovuto probabilmente ad una circostanza significativaç e cioè al aft che nella grande maggioranza queste scuole usano l’inglese come mezzo di istruzione, una lingua nella quale molti allievi hanno raggiunto un livello di competenza almeno pari a quello della propria madrelingua. E a questo punto nasce l’effetto del contraccolpo nocivo di cui si è parlato sopra. Infatti chi è - ad esempio - di madrelingua italiana, e prepara il programma di lingua inglese come Lingua A, finirà per fare un esame di lingua italiana come Lingua B, che è una prova concepita scientificamente come un esame per accertare la competenza di candidati che hanno studiato la lingua italiana come lingua straniera.
Il problema diventa evidente quando si considera che il Baccalaureato Internazionale adotta un testing riferito a norme, e quindi distribuisce i voti dei candidati lungo tutta una curva che descrive le diverse prestazioni dei candidati. E a questo punto è possibile immaginare quale effetto potrà avere per una buona metà di parlanti nativi che si trovano mescolati ad un’ altra metà di candidati i quali sono effettivamente candidati di lingua straniera. Questo grande limite nel concepimento e nell’ amministrazione di un testing linguistico può tuttavia passare inosservato alle scuole, anche agli stessi insegnanti e quindi alle famiglie, le quali tradizional-mente si fidano soprattutto del buon nome di una organizzazione internazionale, e non possono avere la competenza tecnica che invece possiede chi si occupa scientificamente di testing linguistico, e giustamente potrebbe avanzare qualche riserva di principio e alcune forti obiezioni di natura etico-professionale a proposito della serietà di questo tipo di valutazione.
Infine una terza esperienza, che è forse quella più consciuta dal pubblico di questa sala, è quella dell’European Framework che si è sviluppata nell’ambito del progetto omonimo fondato presso il Consiglio d’Europa, e che ha prodotto l’ormai conosciuto Language Portfolio, che in Italia è conosciuto come Portfolio Linguistico. Ho precedentemente ricordato che questo progetto è stato il risultato di un’ esperienza rivoluzionaria nel settore dell’ insegnamento delle lingue straniere del Consiglio d’Europa, che sono sicuro tutti voi conoscerete già con il nome ormai storico del Livello Soglia. Il Portfolio Europeo oggi vuole applicare alla valutazione lo stesso Common European Framework già precedentemente utilizzato nell’approccio del livello soglia: ma ad essere precisi il Portfolio non è un vero e proprio strumento di testing linguistico. Infatti non si tratta di una serie di prove, che vengono ad aggiungersi agli esami di lingue straniere già esistenti, ma è piuttosto un sistema concepito per confrontare esperienze linguistiche diverse e tradurre i risultati già ottenuti nelle prove più disparate attraverso una scala convenzionale di conversione, per poter poi arrivare ad una valuatazione che sia leggibile e comprensibile da tutti in Europa , proprio perchè basata su un sistema di descrizione sovranazionale.
Ci sono almeno due ragioni storico-scientifiche che hanno portato il progetto del Consiglio d’Europa a preferire questa scelta. La prima ragione è quella cui accennavo all’inizio, della indisponibilità di un organismo politico come l’Unione Europea, o di un’assemblea consultiva come quella del Consiglio d’Europa, di prestare il proprio nome come arbitro designato a valutare la competenza linguistica dei parlanti di lingue straniere in tutee il nostro continente europeo. Questa posizione esprime una forma di rispetto nei confronti delle diverse tradizioni nazionali in materia di didattica e di valutazione. La seconda ragione è ancora più significativa da un punto di vista scientifico, ed è quella che emerge dal fatto che nel decennio appena trascorso sarebbero già crollati alcuni miti importanti della fase socio-comunicativa del testing linguistico, proprio in seguito ad alcune forti critiche che sono state avanzate dalla pedagogia sperimentale più innovativa. In questa fase di chiusura ne accennerò solo velocemente e rimando chi potrebbe essere interessato ad approfondirli alla ricca letteratura di accompagnamento del Portfolio Linguistico..
Una prima riserva riguarda la generalizzazione dei dati su cui costruire una valutazione. Infatti l’elemento che aveva attribuito tanta credibilità ai test che dichiaravano di ricostruire un contesto d’uso era proprio il concetto di autenticità. Ci si è accorti che è sempre possibile creare uno sfondo realistico per le prove, ma gli espedienti, anche quelli tecnologicamente più avanzati, non basteranno mai a renderlo veramente autentico.Una seconda riserva riguarda la nozione di competenza comunicativa che tanto aveva condizionato l’abbandono delle valutazioni che si concentravano sulle strutture della lingua per privilegiare invece la capacità d’uso nelle quattro abilità. Ci si è accorti che è vero che separando le quattro abilità la valutazione riesce più attendibile, e riesce anche ad assegnare giudizi più specifici e mirati nel caso di discrepanza tra livelli diversi, cioè tra le abilità di chi sa leggere e ascoltare meglio di quanto non sappia parlare o scivere. Ma la ricerca sociolinguistica che oggi si sta affermando in senso più umanistico tende a sottolineare sempre più il carattere integrativo delle diverse abilità nel loro uso quotidiano, così come nel loro apprendimento. E questo è un fatto che non può essere ignorato nella valutazione.
Per concludere, in questa nuova prospettiva che si sta facendo strada nel testing linguistico, cioè nella valutazione della competenza in una lingua straniera, che è oggi è forse più umanistica e meno pragmatica che in passato, viene dato più spazio proprio al processo di autovalutazione, il quale viene visto come un importante momento di consapevolezza da parte di chi apprende, e quindi di negoziato sia didattico che intellettuale con chi insegna. In questo senso il processo di valutazione, nei ragazzi come negli adulti, d’ora in poi dovrebbe riuscire a coinvolgere sia l’esaminatore che il candidato, in modo da aumentare e perfezionare la capacità del cosiddetto auto-monitoraggio che in tutti i tipi di apprendimento, ma soprattutto in quello delle lingue straniere, gioca davvero un ruolo insostituibile.