Tu sei qui

La qualità è una caratteristica misurabile?

Siamo circondati da una moltitudine di oggetti tecnologici, e ci aspettiamo che funzionino: ci stupiamo se il motore di un’automobile non si avvia o se lo schermo di uno smartphone non si illumina, non viceversa. Questa affidabilità deriva dall’efficacia dei metodi che la tecnologia ha ereditato dalle scienze fisiche, e tra questi la misurazione ha un ruolo importante.

Misuriamo per acquisire informazione su proprietà (attributi, caratteristiche, qualità, grandezze,...) di oggetti (corpi materiali, fenomeni, processi,...) nella forma di valori di tali proprietà. Per esempio, prima di misurare già sappiamo che il piano rettangolare di un tavolo ha varie proprietà e tra queste una lunghezza, e misuriamo per trovare un valore per tale lunghezza, supponiamo 2,30 m.
Come l’automobile e lo smartphone, anche la misurazione è un’entità tecnologica, e ci si aspetta perciò “che funzioni”.
E che la misurazione generalmente produca risultati affidabili è proprio l’affidabilità delle automobili e degli smartphone, progettati e realizzati anche grazie a misurazioni, a provarlo. Dunque cercare di rendere misurabile una proprietà, e poi misurarla quando è utile disporre di valori per tale proprietà degli oggetti a cui siamo interessati, sono attività che generalmente hanno una giustificazione: in un senso da specificare, la misurazione fornisce informazione affidabile.
Questa semplice considerazione ci avvicina al tema generale della riflessione che propongo qui, a proposito della possibilità, e nel caso dell’utilità, di misurare proprietà non-fisiche come la qualità di un oggetto o di un servizio, la gradevolezza di un ambiente, l’ergonomicità di uno strumento, l’amichevolezza di un’interfaccia utente,...La questione pare avere dunque un senso e un’utilità, ed è complessa. Quelli che seguono sono solo cenni, che il lettore interessato potrebbe decidere di sviluppare con altre letture.*


* Qualche suggerimento. Un libro con un’ottima introduzione, sia storica sia concettuale, alla misurazione delle proprietà non-fisiche è O.D. Duncan, Notes on Social Measurement, Russell Sage, 1984.
Con un’impostazione ancora più esplicitamente storica, e con tante provocazioni non ovvie, è S.J. Gould, The Mismeasure of Man, Norton, 1996. Un poco più tecnico, e quindi inevitabilmente anche più specifico, ma sempre ben leggibile è infine J. Michell, Measurement in Psychology - Critical History of a Methodological Concept, Cambridge University Press, 2004.

La misurazione non è naturalmente l’unico strumento con cui acquisiamo informazione in forma di valori di proprietà di oggetti. Potremmo arrivare a descrivere il tavolo come lungo 2,30 m anche con una valutazione a occhio, chiedendo un parere a qualcuno, fidandoci del fatto che il tavolo è stato costruito sulla base di un progetto che prevede che sia lungo proprio 2,30 m, e così via. Ma nessuno di questi altri metodi generalmente funziona bene quanto la misurazione: “è una misura, non un’opinione” è un messaggio chiaro.
Per ottenere l’affidabilità che ci si aspetta da una misura, dunque non basta produrre un valore numerico per la proprietà di cui ci stiamo occupando: se anche l’esperto fornisce informazione quantitativa (l’oggetto ha qualità 4 in scala da 1 a 5, questo ha una qualità del 30% maggiore di quello, ecc), non possiamo ancora concluderne che ciò sia il risultato di una misurazione.
Se chiediamo a una persona quanto sia soddisfatta di un servizio di cui ha usufruito, dovrebbe essere chiaro che l’affidabilità della risposta non dipende dal fatto che le cinque risposte possibili siano da “per nulla” a “molto soddisfatto” oppure da 1 a 5. Data l’osservazione di quanto i numeri siano suggestivi nella comunicazione sociale, questa nota non è forse del tutto scontata: dobbiamo trovare una giustificazione dell’affidabilità della misurazione in qualcos’altro.

Una seconda e complementare considerazione riguarda ciò che si misura: ci sono condizioni da porre perché una proprietà sia misurabile? La questione è controversa, e qui mi accontento di proporre qualche ipotesi.
Innanzitutto, per essere misurabile una proprietà deve essere empirica, invece che informazionale. Per esempio, ogni numero intero positivo ha la proprietà di avere un certo numero di divisori, ma per stabilire che i divisori del numero 6 sono 4 (e cioè 1, 2, 3, e 6) si deve calcolare, non misurare. La differenza è analoga a quella che c’è tra la matematica e le scienze empiriche, come la fisica, la chimica, la biologia, ecc, e non è trascurabile: la verità di un’asserzione matematica è un fatto interno al sistema in cui quell’asserzione è prodotta, mentre per stabilire se è vero che un certo tavolo ha una certa lunghezza dobbiamo interagire con il mondo, con tutti i problemi che ciò comporta. In un’epoca come la nostra, in cui pare che tutto stia diventando “dato” (in inglese questo fenomeno lo si sta chiamando “datafication”), rimarcare che spesso i dati non sono dati, ma siamo noi a doverceli prendere, acquisendoli appunto dal mondo con attività concrete, non è banale.
Un’altra condizione (che potrebbe sorprendere chi non ha una qualche famigliarità con questioni filosofiche...) è che per poter essere misurata una proprietà deve esistere. E, proprio perché sono proprietà empiriche ad essere misurabili, è una condizione che può essere non ovvia da stabilire. Non è infatti certo sufficiente che noi sappiamo parlare di un’entità perché essa esista in quanto entità empirica: scrivendo di unicorni questi diventano esistenti come oggetti letterari, non certo come entità biologiche. Come possiamo dunque garantire che proprietà come la qualità di un oggetto o la gradevolezza di un ambiente esistano? Basta che ci sia un accordo intersoggettivo abbastanza ampio? Certo, a differenza di quella fisica, la realtà sociale è costruita, ma la costruzione non comincia ogni volta da zero, e quindi ci si aspetta che i pezzi abbiano una certa mutua coerenza. Supponiamo per esempio di aver costruito un questionario per raccogliere le opinioni delle persone che hanno usato un certo servizio. Il problema riguarda l’interpretazione che daremo alle risposte. Si tratta genericamente di opinioni (su una parte più o meno ben distinta del mondo che ha a che vedere con il servizio) o specificamente di opinioni sulla qualità del servizio? (chi avesse dei dubbi sul concetto di "opinioni generiche" potrebbe frequentare qualche blog su internet...). Il progettista del questionario potrebbe aver fatto del suo meglio perché le domande esplicitino in modo specifico le opinioni degli utenti sulla qualità del servizio, ma come ha garantito che la stessa domanda sia stata interpretata nello stesso modo da persone diverse?
E quindi, operativamente: come ha garantito che se due persone hanno dato la stessa risposta a una domanda è perché davvero hanno la stessa opinione sul servizio?
E vice versa se due persone hanno dato risposte diverse a una domanda è perché davvero hanno opinioni diverse?
Nel caso più radicale, in cui non c’è alcuna garanzia di ciò, la conclusione che a rigore dovremmo trarre è che la proprietà/qualità del servizio, in quanto tale non esiste, ed esistono invece tante proprietà/opinione della persona x sul servizio. Non ci sarebbe allora da stupirsi se l’affidabilità dell’informazione ottenuta dal questionario, se interpretata in termini della qualità del servizio, si riveli bassa.

Di fronte a questo scenario, una tecnica usuale -e non sempre adottata rendendo esplicite queste premesse- è di affidarsi alla statistica, sulla base di un’ipotesi del tipo: se anche la singola risposta non è affidabile, la media (o magari la mediana, per coloro che sono un poco più sensibili a questioni di significatività statistica) delle risposte lo è. E quindi ecco i numeri ricomparire, dato che si possono calcolare medie di numeri e non di valori qualitativi. Certo, con “big data” sempre più disponibili a costi sempre più bassi, questa opzione è attraente. Ma bisognerebbe ammettere che l’ipotesi che in questo modo si ottenga informazione affidabile è basata su un’altra ipotesi, che nella sua versione estrema è la seguente: la sintesi dell’informazione prodotta da tanti non-esperti è migliore dell’informazione prodotta da un singolo esperto. Penso che si possa accettare senza troppe difficoltà che non per ogni tipo di problema questa ipotesi è valida...
La sua versione metrologica è pure interessante: la sintesi dell’informazione prodotta da tanti strumenti di bassa qualità e non tarati è migliore dell’informazione prodotta da un singolo strumento di alta qualità e tarato (si potrebbe considerare questo come il motto di certi programmi di IoT, l’“internet delle cose”...). Questo riferimento alla taratura degli strumenti di misura è un suggerimento per il progettista del questionario, che migliorerebbe l’affidabilità dell’informazione ottenuta dalle risposte se potesse, anche in questo caso, tarare lo strumento. Si tratta di un punto cruciale: da una misurazione ci si aspetta che produca informazione relativa all’oggetto sotto misurazione (e perciò oggettiva) e indipendente dal soggetto che misura (e perciò intersoggettiva), e la taratura dello strumento è una condizione fondamentale per questo. È infatti la taratura che ci garantisce che lo stesso valore di lunghezza prodotto da strumenti diversi, per esempio 2,30 m, corrisponde alla stessa lunghezza.
La taratura di uno strumento ha dunque lo scopo di garantire quella che si chiama la riferibilità metrologica, a un riferimento socialmente condiviso, dei valori prodotti dallo strumento. Nel caso delle grandezze fisiche i riferimenti sono le unità di misura, e quindi è grazie alla taratura degli strumenti che, per esempio, il metro è realizzato ovunque come la stessa lunghezza.
Tornando all’esempio del tentativo di misurare la qualità di un servizio attraverso un questionario, lo strumento è una coppia (persona che compila, questionario), ed è tale coppia che dunque andrebbe tarata. Come precondizione, bisognerebbe essersi dotati di un riferimento, con una funzione analoga all’unità di misura, a cui rendere riferibili le opinioni che attraverso il questionario le persone esprimono. Se si accetta che i risultati possano essere non numerici, il riferimento potrebbe consistere in un insieme di descrizioni di “casi tipo” di qualità, e lo strumento (persona che compila, questionario) potrebbe essere tarato insegnando come usare il questionario per interpretare il servizio alla luce dei “casi tipo”.
Certo, si tratta di un’operazione costosa, ma è l’analogo minimo di quello che per esempio nella pratica industriale è richiesto per una certificazione di qualità: gli strumenti di misura che si usano devono essere tarati, e periodicamente la taratura deve essere controllata e, se necessario, rifatta.
Un caso interessante, che non ha un corrispondente nel caso della strumentazione fisica, è poi quello in cui la persona che compila il questionario è un esperto: potremmo infatti considerare il processo di apprendimento che ha reso esperto l’esperto come una sorta di taratura progressiva (gli strumenti di misura fisici non imparano, almeno per ora...). In tal caso delle differenze sistematiche nelle risposte fornite da esperti potrebbero essere considerate significative, ben al di là di un fatto meramente statistico, per esempio come segnali del fatto che la proprietà in considerazione è multidimensionale e ogni esperto ne ha messo in evidenza dimensioni parzialmente diverse.
Al di là dei dettagli, per altro qui davvero solo accennati, quello che si ottiene è una delle caratteristiche più significative della scienza: il metodo, più o meno ben definito, su cui si sviluppa non garantisce la verità dei risultati, ma espone a tutti il processo con cui li si è ottenuti, rendendoli così analizzabili, criticabili, ed eventualmente migliorabili, da chiunque. In tutto ciò la misurabilità di una proprietà non è una condizione binaria, che o non c’è del tutto o c’è pienamente. Il processo per rendere misurabile una proprietà si realizza in passi successivi, e ognuno, una volta compiuto, rende l’informazione sulla proprietà sempre migliore.

 

LUCA MARI:
Professore ordinario presso l’Università Cattaneo - LIUC, dove insegna in corsi di metodi matematici applicati all’ingegneria. Svolge attività di ricerca a proposito di scienza della misurazione e sulle sue relazioni con le scienze e tecnologie dell’informazione, e in questo contesto è autore di varie pubblicazioni scientifiche. Ha incarichi in organizzazioni nazionali e internazionali di normazione tecnica, e coltiva le relazioni con il mondo della scuola per contribuire a diffondere la cultura scientifica.