Годината на звездичката? Предложението за тестване на Калифорния подкопава отчетността, базирана на тестове

Докато държавите планират нови оценки на студентите, съобразени с Common-Core, през пролетта на 2015 г., политиците се борят да прехвърлят своите програми за тестване и отчетност. Миналата седмица законодателите в Калифорния предприеха безпрецедентна стъпка: те гласуваха да прекратят стария си тест и да проведат полеви тест за по-интелигентната балансирана оценка в целия щат през пролетта на 2014 г. По-противоречиво е, че те ще изключат много отговарящи на условията студенти от теста и ще задържат резултати от училищни райони, учители или родители. Този аспект на плана предизвика предупреждения от Министерството на образованието на САЩ, излагайки на риск 1,5 милиарда долара годишно федерално финансиране на дял I.



Разбираемо е, че секретарят Дънкан би искал да обезкуражи подобни усилия. Има много щати в подобна позиция като Калифорния, тъй като планират да участват в полеви тест с консорциума Smarter Balanced или Partnership for Assessment of Readiness for College and Careers (PARCC) през пролетта. Ако министърът Дънкан даде отказ на Калифорния за сегашния й план, други щати вероятно ще последват примера. Противно на схващанията на законодателите и администраторите в Калифорния, това не е просто двубой между Калифорнийското министерство на образованието и секретаря Дънкан (които са се карали преди). Напротив, този спор има по-широки последици за отчетността, базирана на тестове, в цялата страна.

На 17 септември Министерството на образованието на САЩ издаде нови насоки на щатите, сигнализирайки, че могат да очакват отказ, който да замени който и да е от теренните тестове със съществуващите им държавни тестове, стига отговарящите на условията ученици в щата да вземат както оценка по английски, така и по математика . При значителна отстъпка от държавите няма да се изисква да докладват резултати за тези студенти, които се явяват на полевия тест. За целите на отчетността училищата за полеви тестове могат да използват своите резултати от 2012-13 г. в съответните класове. В насоките имплицитно е допускането, че държавите ще администрират полевия тест в ограничен брой училища или класни стаи.





Поне докато Калифорния не обяви плановете си наскоро, повечето от членовете на консорциума Smarter Balanced планираха да направят точно това: да администрират полевия тест на 10% извадка от студенти и да запазят съществуващите тестове за още една година за огромното мнозинство от студентите.

Но мнозина в Калифорния (а може би и в други щати) ще бъдат недоволни от новите насоки. Те ще твърдят, че е по-разумно да се отправим към новите стандарти сега, за да се позволи на учителите и училищата да започнат да се подготвят за по-високите очаквания на Общото ядро. В същото време те твърдят, че би било несправедливо да се търси отговорност от учители, училища и ученици за тяхното представяне през този междинен период. Ако решат да следват този курс, те трябва да преработят своите полеви тестове, за да функционират като оценки в цялата страна и да предоставят резултати обратно на учениците и училищата.



Калифорнийският план

Лидерите в Сакраменто взеха това, което беше предназначено да бъде ограничен полеви тест на новата оценка и се опитаха да го разширят, за да покрият дължината и ширината на Калифорния. Не е подходящо, защото полевият тест никога не е бил предназначен да бъде оценка в цялата страна.

Много други посочиха недостатъците на предложението: училищните райони, които не са подготвени за електронната версия, може да нямат опция за писане на хартия и молив; много студенти ще вземат или изпита по математика или ELA, но не и двете.



какво е кралица на испански

Има обаче и други проблеми, които привличат изненадващо малко внимание. Например, не е ясно колко учители, ученици и родители ще научат през тази междинна година, ако резултатите им бъдат открити от тях. В баскетбола тренировъчният удар е полезен само когато виждате дали топката влиза или не. Съгласно предложението държавата моли учениците и учителите да правят тренировъчни удари на тъмно.

Може би по-важното е, че за целите на полевия тест дизайнерите на тестове се нуждаят само от отговори от 10 процента от студентите в Калифорния във всяка предметна област. (Ако учениците взеха и двата теста, това щеше да са 10 процента от учениците; ако учениците взеха ELA или математика (но не и двете), това ще бъде 20 процента от учениците в Калифорния.) Не е ясно дали разработчиците на тестове дори биха отбелязали останалите тестове! Така че може да има милиони студенти в Калифорния, които прекарват 3,5 часа в тест по предмет, който никога няма да бъде отбелязан. (Като се има предвид, че оценките така или иначе ще бъдат задържани, предполагам, че единственото нещо по-ирационално би било да се направи огромната цена за оценяване на всички тестове и след това задържане на резултатите.)

Препроектиране на полевия тест, за да функционира в целия щат



Тези, които се застъпват за по-ранен преход към оценка в съответствие с общото ядро, имат право. Те също така смятат, че мораториумът върху високите залози може да е подходящ през година на преход. Въпреки това би било загуба да не се използва годината на прехода, за да се каже на учениците, учителите и родителите къде се намират спрямо новите стандарти, а това означава да се даде възможност на всички ученици да участват в теста, да отбележат всичките си тестове и да им предоставим с резултат.

Ето една опция, която ще бъде налична сега: (i) Администриране на новите оценки на всички отговарящи на условията студенти; (ii) оценете оценките за произволно избрани 10 процента от учениците; (iii) Оценете параметрите на артикула и отстранете елементите, които не са се представили според очакванията; (iv) Върнете се и отбележете останалите тестове за останалите 90 процента от учениците; (v) Предоставяне на скалирани резултати обратно на училищните райони, родителите и учителите.

Очевидно един държавен партньор в консорциума Smarter Balanced обмисля този вариант (въпреки че името му е задържано до окончателно решение).



Лидерите на консорциума Smarter Balanced обаче обезкуражават държавите да правят това. Защо? Има две причини. Първо, полевият тест е предназначен да тества отделни елементи, а не да осигури надеждни скалирани резултати за отделни ученици. Едно от ключовите съображения при проектирането на полеви тест е броят на общите елементи, споделени в множеството формуляри. Колкото по-голям е блокът с общи елементи, толкова по-надежден ще бъде скалираният резултат за отделните ученици. Въпреки това, когато броят на често срещаните елементи е голям, размерът на извадката, наличен за нечесто срещаните елементи, се свива. Когато има много елементи за тестване и ограничен брой студенти са налични, дизайнерите на тестове трябва да ограничат размера на блока с общи елементи.

През 2015 г. тестът за по-интелигентно балансиране ще има адаптивен дизайн и адаптивните тестове изискват много елементи (тъй като всеки ученик ще получава елементи, съобразени с тяхното ниво на постижения). В резултат на това, за да тестват по-голям брой елементи, дизайнерите бяха принудени да използват сравнително малък общ блок от 10 елемента при полевия тест.

Малкият брой общи елементи кара разработчиците на теста да се притесняват от получените резултати на ниво студент. Все още е възможно да се генерира мащабиран резултат за всеки ученик. И скалираният резултатщепредоставят информация за вероятния резултат на ученика за бъдещите по-интелигентно балансирани оценки. Но няма да бъде толкова надежден, колкото ще бъде крайната оценка.

каква е била викторианската ера

Но, разбира се, настоящият дизайн на полевия тест се основава на очакването, че само 10 процента от студентската популация ще се яви на теста. Ако полевият тест трябваше да бъде 10 пъти по-голям, той би позволил различен дизайн, с по-голям набор от общи елементи, повече формуляри, по-малко необичайни елементи във всяка форма. Типичният полеви тест е предназначен само за тестване на параметрите на елемента. Но като се стреми да даде на студентите и учителите начален старт в Общото ядро, държавата иска нещо, което типичният дизайн на полеви тест не може да осигури. Преработено изпробване в цялата страна на оценката по-интелигентно балансирано може да служи както на типичната функция на полеви тест, така и да генерира по-надеждни резултати на ниво студент.

Втората причина, поради която консорциумът Smarter Balanced обезкуражава този подход, е политическа. По-интелигентното балансирано ръководство се интересува преди всичко от оценката на параметрите на артикула, а не от генерирането на резултати от студентско ниво. Информационната стойност за калифорнийските ученици, учители и родители не е тяхна основна грижа. Освен това, ако опишат план за генериране на резултати на ниво студенти като работещ, те рискуват да отблъснат организираните интереси в Калифорния, които се наслаждават на перспективата за година без резултати от тестове (дори и да не е година без тестове!). Следователно за тях стана политически целесъобразно да твърдят, че каквито и да било резултати биха били безсмислени, дори и да знаят по-добре.

Следователно, ако Калифорния или друг щат желае да ускори прехода към Общото ядро, той не трябва да се опитва да разтяга ограничен тест на място, за да обслужва целия щат, трябва да преработи полевия тест, да премахне лошо функциониращите елементи и да произвежда на ниво студент скалирани резултати, постигащи минимално ниво на надеждност. Въпросът за това как се използват тези тестове — и дали някакво освобождаване позволява мораториум върху използването на тези тестове за цели с високи залози — е отделен въпрос. При липса на такъв пробив 2014 г. може да се превърне в годината на звездичката в Калифорния и евентуално в други щати.