Questo documento descrive le linee guida generali in base alle quali gli psicometrici interni Prometric valutano e contrassegnano gli oggetti interni per un'ulteriore revisione. Queste linee guida si applicano a quei programmi che utilizzano la teoria dei test classica.

Tabella 1: Riepilogo delle specifiche statistiche

Elementi di assemblaggio di moduli e revisione statistica

Specifiche / Standard

1. Gamma di difficoltà dell'articolo

Valori P = .30 - .89 (ottimale) *

2. Valori target per gli indici di discriminazione degli articoli

rpBis> .20

3. Intervalli target per la stima dell'affidabilità della coerenza interna

Alpha> .80

4. Intervalli target per le stime di coerenza o affidabilità della classificazione Livingston> .80

Gli intervalli accettabili sono maggiori degli intervalli ottimali e sono spiegati di seguito

Gamma prevista di difficoltà dell'oggetto

Valore P = da 0,30 a 0,89

Il personale di Prometric è addestrato a riconoscere che i singoli valori p non rappresentano né un valore assoluto, ripetibile né giustificano un'interpretazione concreta. Piuttosto, gli psicometrici Prometric esaminano tutte le informazioni di analisi degli oggetti disponibili per valutare le tendenze. Nota: i soli valori p non sono sufficienti per la maggior parte delle interpretazioni degli elementi. Tutte le revisioni di base degli articoli incorporano valori p e rpBis prima di prendere decisioni sulla disposizione degli articoli.

Tabella 2: Linee guida per il valore p
valore p (da facile a difficile) Interpretazione dell'oggetto

Da 1.00 a 0.96

Articoli inaccettabili con un valore di misurazione minimo che devono essere contrassegnati per la rimozione o la revisione da parte delle PMI.

Da 0,90 a 0,95

Articoli molto facili (forse inaccettabili): rivedere rpBis per un'adeguata discriminazione. Potrebbe essere necessario rivedere le mie PMI.

Da 0,89 a 0,80

Articoli abbastanza facili (accettabili): rivedere rpBis per confermare la discriminazione.

Da 0,79 a 0,40

Elementi difficili o moderatamente facili (accettabili): utilizzare se rpBis rientra nelle specifiche.

Da 0,39 a 0,30 Elementi difficili (accettabili): rivedere attentamente rpBis, utilizzare se rpBis rientra nelle specifiche.
Da 0,29 a 0,20 Elementi molto difficili (forse inaccettabili): rivedere rpBis per un'adeguata discriminazione. Potrebbe essere necessario un riesame da parte delle PMI.
Da 0,19 a 0,00 Articoli inaccettabili: inadeguatamente difficili o altrimenti imperfetti. Deve essere contrassegnato per la rimozione o la revisione da parte delle PMI.

Quando un articolo risulta essere marginale, gli sviluppatori osservano l'rpBis dell'elemento. Se rpBis è alto, viene data più tolleranza per mantenere quell'oggetto nell'esame.

Valore / i obiettivo / i per gli indici di discriminazione degli articoli

rpBis = da 0,20 a 1,00

Il punto Biserial (rpBis) viene utilizzato dagli psicometrici Prometric per determinare il potere di discriminazione di ciascun oggetto. Come altre statistiche classiche, l'uso di rpBis non è una scienza esatta. In alcuni casi, valori rpBis bassi possono derivare da valori p particolarmente alti o bassi, bassa varianza degli oggetti dovuta a distrattori non plausibili, bassa varianza di punteggio dovuta all'omogeneità dei candidati o distribuzioni di punteggio estremamente distorte. Pertanto, gli psicometrici Prometric sono tenuti a prendere in considerazione diverse statistiche durante la revisione delle analisi degli articoli. La Tabella 3 riassume le linee guida utilizzate dagli sviluppatori durante la revisione della discriminazione degli articoli. Si noti che queste linee guida presuppongono che l'articolo sia correttamente codificato e che il campione di candidati sia sufficientemente grande.

Tabella 3: Linee guida rpBis

RpBis (da forte a debole)

Interpretazione dell'oggetto

1,00 a 0,50

Molto forte (accettabile)

Da 0,49 a 0,30

Forte (accettabile)

Da 0,29 a 0,20

Accettabile (ma potrebbe essere necessario un riesame)

Da 0,19 a 0,10

Elementi marginali (forse inaccettabili): rivedi attentamente testo e distrattori.

Da 0,09 a 0,00 Oggetti deboli (inaccettabili): i valori di p sono probabilmente molto alti. Flag per rimozione o revisione da parte delle PMI.
Da -0,01 a -0,20

Articoli inaccettabili: inadeguatamente difficili o altrimenti imperfetti. Deve essere contrassegnato per la rimozione o la revisione da parte delle PMI.

La tabella 4 elenca le interpretazioni utilizzate dal team psicometrico per varie gamme di coefficienti alfa.

Tabella 4: Linee guida Alpha

Alfa

Interpretazione dell'affidabilità di coerenza interna

Meno di 0,60

Coefficienti inaccettabili che richiedono nuove forme

Da 0,60 a 0,69

Scarsi coefficienti che richiedono la revisione o la rimozione del modulo

Da 0,70 a 0,79

Coefficienti marginali che possono richiedere la revisione / revisione del modulo

Da 0,80 a 0,89

Buoni coefficienti

0,90 o superiore

Coefficienti eccellenti

L'intervallo target per le stime della coerenza della classificazione o dell'affidabilità della decisione Pass / Fail

r = 0,80 o superiore

Prometric ha selezionato il metodo di perdita degli errori quadrati di Livingston per il calcolo dell'affidabilità della coerenza delle decisioni. Questo metodo è stato selezionato perché può essere interpretato come altre misure di affidabilità (discusse sopra). È molto meno complesso dei metodi di perdita soglia e può essere eseguito per tutti i moduli a singola amministrazione. L'uso di questa statistica è coerente con lo standard 2.3 negli standard per i test educativi e psicologici, pag. 20.

Consigli prometrici - Rapporti bancari degli articoli
Gli standard interni di Prometric e le raccomandazioni dei clienti per le banche di articoli sono indicati nella Tabella 1 di seguito.

Tabella 1: Raccomandazione per le banche articoli per la consegna basata su modulo standard

Livello di raccomandazione

Gamma

1. Intervallo target minimo

Numero da 1,5 a 2 volte di articoli per modulo

2. Target Range accettabile

Numero di articoli da 2 a 3 volte per modulo

3. Intervallo target ottimale

Numero di articoli da 3 a 5 volte per modulo

Ritorna alla pagina relativa all'efficienza del test e alla difendibilità legale