Доказателство за изпитните училища в Ню Йорк и Бостън

Ню Йорк се бори какво да прави с училищата си за изпити. Студентите в Stuyvesant, Bronx Science и Brooklyn Tech (най-старите училища за изпити) се представят блестящо и посещават най-добрите колежи. Техните ученици имат резултат 99типроцентил на държавното SAT разпределение (със Stuyvesant при 99,9типроцентил) и те представляват по-голямата част от студентите в Ню Йорк, посещаващи Харвард, Принстън и Йейл.единТова по всякакъв начин са елитни училища и се почитат като бижута на градската училищна система.





Но от 900-те първокурсници, които се записаха в Stuyvesant тази есен, само 10 бяха чернокожи.двеСпоред държавното законодателство приемът в тези училища става чрез специализиран, доброволен тест за прием. Кметът Бил де Блазио и други се оплакват, че тази система за прием увековечава неравенството във възможностите за отлично образование.



Много мастило е разлято върху училищата за изпити, в популярните новинарски издания, както и в академичните списания. В тази статия се занимавам с тесен, но уместен въпрос: причинно-следственото въздействие на тези училища върху учениците, които ги посещават. Изпитните училища дават ли академично отлични висшисти или просто приемат звездни студенти и се радват на заслуга за успехите си? Също така накратко обсъждам алтернативните методи, които градът би могъл да използва, за да разпредели оскъдните места в тези училища с прекалено абонамент.



Разбирането на ефективността на всяко училище е предизвикателство, защото родителите избират училищата на децата си. В много случаи училището, което детето посещава, е свързано с неговия адрес, така че родителят ефективно избира училище, когато избира местоживеене. На места като Ню Йорк и Бостън, които имат избор в целия район, семействата могат да избират измежду десетки държавни училища, включително чартъри, магнити и училища за изпити. И има частни училища за тези, които могат да си ги позволят или които имат ваучери за субсидиране на разходите.



Тъй като родителите имат избор, някои училища са пълни с ученици (да речем, деца на добре образовани, силно мотивирани родители), които биха се представили добре в почти всяка среда. Този модел може да ни подведе да мислим, че такива училища предоставят образцово образование, когато истината е, че те просто привличат силни ученици.



Това е пристрастност при подбора, най-голямото предизвикателство при оценката на ефективността на училищата. Гимназията Stuyvesant е пълна с умни ученици, които могат да успеят навсякъде. Когато тези ученици се справят добре, това е заради училището или учениците или и двете?



В случай на училища за изпити, имаме пристрастия към подбора на стероиди. Студентите, които влизат в Stuyvesant, имат резултати от теста за средно училище с цели две стандартни отклонения над средното за града - тоест, те имат по-висок резултат от 95% от учениците в държавните училища в града. Как можем евентуално да различим ефекта от изпитните училища пред толкова огромни разлики в изходните постижения?

За да преодолеят това предизвикателство, изследователите са използвали тестовете, които ги правят изпит училища. Съгласно държавното законодателство, входът в училищата за изпити в Ню Йорк се определя от резултата на ученика от теста за приемане в специализирана гимназия (SHSAT). Студент, който получи достатъчно висок резултат, може да спечели прием в Stuyvesant. Малко по-нисък резултат ще я вкара в Bronx Science и т.н.3Изследователите са използвали тези граници, за да оценят причинно-следственото въздействие на училищата за изпити върху академичните постижения на учениците и посещаемостта в колеж.



Методът на изследване се нарича регресионно-прекъснат дизайн. Ключът към този подход е, че по същество е произволно дали някой се озовава точно над или точно под границата. Като сравняваме учениците само от всяка страна на границата, можем да уловим причинно-следственото въздействие на училището върху резултатите на учениците.



Разбира се, съвсем не е случайно, че някои студенти имат много високи резултати, а други много ниски и разбира се, повече от тези с високи резултати ще влязат в училищата за изпити. Точно това виждаме в Ню Йорк. Това, на което разчита регресионно-прекъснатият анализ, е големият, прекъснат скок при посещаване на изпити в училище точно при граничните резултати. Резултат с малко над границата гарантира допускане, докато резултат малко по-нисък води до отхвърляне. Тези пропуски могат да бъдат резултат от произволни вариации в теста или от това как се чувства ученикът в деня на теста.

Две групи икономисти приложиха методологията на регресия-прекъснатост при изучаването на изпитните училища в Ню Йорк. Atila Abdulkadiroğlu (Университет Дюк), Joshua Angrist и Parag Pathak (и двамата от Масачузетския технологичен институт) публикуваха The Elite Illusion: Achievement Effects в изпитните училища в Бостън и Ню Йорк в Иконометрия докато Уил Доби (Принстън) и Роланд Фрайър (Харвард) публикуваха Въздействието на посещаването на училище с връстници с високи постижения : Доказателство от изпитните училища в Ню Йорк в American Economic Journal: Приложна икономика .Четири пет



Какво заключават изследователите? Намират точно нулев ефект на изпитните училища относно посещаемостта на колежа, избирателността на колежа и завършването на колеж. Те прехвърлят данните през мелницата и това е невълнуващият резултат. Констатациите за изпитните училища в Бостън са същите, с бонус констатация за нулев ефект върху резултатите от тестовете, включително SAT и PSAT. Авторите отбелязват, че все още е възможно училищата да повлияят на резултатите по-късно в живота, като заетост или богатство. Но ако е така, такъв ефект не действа чрез посещение в елитен колеж.



Какво заключават изследователите? Намират точно нулев ефект на изпитните училища относно посещаемостта на колежа, избирателността на колежа и завършването на колеж.

Тези нулеви резултати отнемат голяма част от въздуха от заложените дискусии за изпитните училища като портали към икономически възможности. Поне за учениците, които са точно на границата на прием в училища за изпити, училищата нямат измерим ефект върху академичните постижения или резултатите от средното образование. Тези ученици може да са по-щастливи, по-ангажирани или по-безопасни в тези училища. Но е изненадващо, че не виждаме ефекти там, където толкова много са ги очаквали.



Докато силната страна на дизайна на регресия-прекъснатост е, че получаваме причинно-следствени ефекти за студенти, които са точно на границата на прием, слабостта е, че не можем да оценим ефектите за студенти, които са сигурни в приема (най-добрите студенти) или тези, които не си правят труда да кандидатстват при сегашния приемен режим.



Градът или поне кметът би искал да разнообрази изпитните училища. Как могат да се разнообразят училищата за надарени ученици? За щастие имаме много отлични изследвания по този въпрос.6, 7

последният ден на тъпака

Настоящият подход за прием почти сигурно изключва много надарени студенти в неравностойно положение. Когато разчитаме на родителите, учителите или учениците да вземат решението да кандидатстват за програма за надарени ученици (като например доброволно се запишат за тест), доказателствата показват, че учениците в неравностойно положение са тези, които непропорционално се изключват.

Но да се отървете от теста е не Отговорът. Добре образованите родители с високи доходи работят по системата, за да вкарат децата си в тези програми. Колкото по-малко прозрачен е подходът (например портфолиа или препоръки за учители вместо стандартизиран тест), толкова по-голямо е предимството на тези умни, свързани родители да спечелят играта.

Важна стъпка е да направите теста универсален , а не такъв, който учениците избирам да взема. В дузината щати, където тестовете за прием в колеж са универсални (безплатни, задължителни и дадени по време на учебните часове), много повече студенти вземат теста и продължават да учат в колеж.8Демократизиращият ефект е най-силен сред студентите с ниски доходи и небелите студенти. Същата динамика се наблюдава и при малките деца: когато тестването за надареност е универсално, бедните, чернокожите и испаноговорящите деца са много по-склонни да се озоват в класове за талантливи.9Училищен квартал във Флорида показа огромно увеличение в разнообразието на своите програми за надарени, когато премина към използване на универсален тест, вместо препоръки от родители и учители, за идентифициране на надарени ученици.

Вместо да принуждава студентите да правят още един тест, Ню Йорк може да използва съществуващите 7ти– и 8ти-тестове за оценка за определяне на прием в изпитните училища. Тези тестове по принцип са съобразени с това, което се преподава в училищата и така са подходящ показател, по който да се прецени постиженията на учениците. Когато толкова много хора се оплакват от прекомерно тестване, защо трябва да има още един тест, за който учениците да се тъпчат и да седят?

Градът би могъл да отиде по-далеч към диверсификацията на студентското тяло, като приеме най-добрите голмайстори във всяко средно училище до изпитните училища. Тексас използва този подход, за да определи допускане до водещите позиции на Тексаския университет: горната част (първоначално 10%, сега по-ниска) от учениците във всяка гимназия автоматично се приема в тези селективни колежи. Това гарантира, че елитните колежи в Тексас поне частично отразяват икономическото, етническото и расовото разнообразие на (силно сегрегираната) училищна система на щата.

Този подход от най-добрите 10% може да накара някои родители да се борят да запишат децата си в училища с по-ниски резултати, където децата им са по-склонни да получат най-добри резултати. Този ефект наистина беше наблюдаван в Тексас. Това не би било непременно лош резултат, тъй като помага за интегрирането на системата в расово и икономическо отношение.

Някои биха могли да възразят, че стандартизираните тестове, дадени на всички студенти, са недостатъчно предизвикателни, за да се избере академичният елит, подходящ за училищата за изпит. Това се нарича ефект на тавана, при който тестът не може да разграничи постиженията с високи и супер високите постижения. Това е правдоподобна теория, но данните не подкрепят тази хипотеза в Ню Йорк. Според екипите, които проведоха анализите, обсъдени по-рано, студентите в Brooklyn Tech имат около 1,5 стандартни отклонения над останалата част от града, което е в рамките на нормалната, измерима вариация на стандартизирания тест на града. Дори в Stuyvesant учениците са в рамките на две стандартни отклонения от града на тестовете за средно училище.

Ако училищата и градът възнамеряват да запазят специализирания тест за прием, те биха могли да го администрират в учебен ден, за да всичко ученици, които имат резултати над даден праг на универсалните тестове за средно училище.

Ню Йорк има много да се бори при решаването на съдбата на своите изпитни училища. Отчитането на научните доказателства за тяхното представяне би било страхотен път напред.