学生のテストのスコアは、彼らが知っているものよりも彼らが住んでいるコミュニティについての詳細を教えてくれます

毎年、米国の政策立案者は、標準化されたテストの結果に基づいて人生を変える決断を下します。 これらの重要な決定には、次の学年レベルへの学生昇進、上級コースに参加する学生の適格性、高等学校卒業資格、および教員資格が含まれますが、これらに限定されません。 40州では、 教師が評価される 一部は学生の標準化テストの結果に基づいており、ほぼ30州の学校管理者も同様です。

しかし、研究は、標準化されたテストの結果は、意図されているように、指導の質を反映していないことを示しています。 同僚と私は ニュージャージー, コネチカット, マサチューセッツ州, アイオワ州 & ミシガン州.

結果は、いくつかの標準化されたテストで熟練度以上の得点を取る学生の割合を予測することが可能であることを示しています。 私たちは、学生 - 教師の比率や教師の質など、学校そのものに関連する要因ではなく、コミュニティの重要な特性のいくつかを見るだけでこれを行うことができます。

これは、教育アカウンタビリティシステムに深刻な欠陥があり、それらのシステム内で作られた教育者や学生に関する決定が下される可能性を高める。

標準化されたテスト

ジョージW.ブッシュ大統領は、米国の教育者、学生、学校を評価するために、標準化されたテストの学生のスコアを使用しました。 同法落ちこぼれません (NCLB)を2002で使用します。

以前は20州よりもいくつかの学年レベルで1990の後期に州のテストが実施されていましたが、NCLBはすべての50州で毎年の標準化テストを義務付けました。 3年生から8年生までの高校では、標準化された数学と英語芸術のテストが必要でした。 国家教育関係者は、4年生、8年生、高校時代に標準化された科学試験を実施しなければならなかった。


インナーセルフ購読グラフィック


オバマ政権は、レース・トゥ・トップ・グラント・プログラムの要件を通じた標準化されたテストを拡大し、 共通のコア状態基準:スマートバランスアセスメントコンソーシアム(SBAC)と 大学とキャリアの準備のためのパートナーシップ (PARCC)。

45州は、当初コモン・コアを何らかの形で採用した。 およそ20は、現在PARCCまたはSBACコンソーシアムの一部です。 レースからトップアプリケーションへの主要な部分では、州が教員や校長を評価するために生徒のテスト結果を使用する必要があります。

スコアの予測

信じられないほどシンプル 既に確立された コミュニティ外の人口統計や家族レベルの変数は、大規模な標準化されたテストでの学生の成果に強く影響します。

たとえば、 家族の平均収入 SAT結果の強力な予測因子です。 州の標準化テストでの達成に強く結びついている他の要因としては、親の教育水準、学校の孤独な親の割合、地域社会の貧困の家族の割合などがあります。

私たちは、学生が住んでいた地域社会に関連する人口統計的要因に基づいて標準化されたテストのスコアを予測できるかどうかを見極めることにしました。 米国国勢調査データから3〜5つのコミュニティおよび家族の人口統計学的変数を調べることにより、 私たちは正確に予測することができました 12から成績3の標準化されたテスト成績で熟練度以上の得点を取った学生の割合。 これらの予測は、学校の大きさ、教師の経験、生徒一人当たりの支出などの学校区のデータ要素を見なくても行われます。

私たちのモデルは、特定の変数が学生の得点にどれだけ影響を与えるかを特定することができます。 これにより、テスト結果に関連する最も重要な人口統計的特徴を特定することができます。 例えば、貧困に暮らしている特定の地域社会の家族の割合を見てみると、8級の英語芸術におけるテストのスコアのほぼ58%を説明することができます。

私たちの最新の研究 300ニュージャージー州の学校よりも6年生から8年生までの3年間の試験得点を調査しました。 私たちは、年間US $ 200,000以上の収入、貧困地域の人々の割合、学士号を持つ地域社会の人々の割合で地域社会の家族の割合を調べました。 私たちは、サンプリングした学校の75パーセントで熟練度以上のスコアを出した学生の割合を予測できることを発見しました。

以前の研究 ニュージャージー州の第5学年の試験得点に焦点を当てたものは、3年間で学校の84パーセントの結果を正確に予測していました。

スマートアセスメント

明らかにするために、これは、お金がどのくらいの学生が学ぶことができるかを決定することを意味しません。 それは真実から遠いものではありません。 実際、標準化されたテストでは、どのくらいの学生が学ぶか、教師がどれくらいうまく教えるか、または学校リーダーが学校をどの程度効果的に導くかは測定できません。 このようなテストは、学校外要因の測定に非常に敏感な鈍器である。

標準化された評価の支持者の中には、改善を測定するためにスコアを使うことができると主張している人もいますが、単純にあまりにも多くのノイズがあることがわかりました。 試験の得点の年々の変化は、学生が悪い一日を過ごしたか、病気や疲れを感じているか、コンピュータの誤動作、または他の無関係の要因にかかわらず、学年の正常な成長に起因する可能性があります。

標準化されたアセスメントの作成者が発行した技術マニュアルによれば、現在、教師または学校管理者の有効性や学生の達成度を判断するために使用されているテストは、これらの用途で検証されていません。 例えば、PARCC研究のいずれも、 PARCC提供これらの問題を直接解決します。 テストは学習を診断するためのものではありません。 彼らは技術的な報告書に示されているように、単純にデバイスを監視しています。

要するに、能力や成長を測定しようとしていても、標準化されたテストは答えではありません。

いくつかの州で私たちの結果は魅力的でしたが、テストのスコアが学校外の要因の影響をどれくらい受けているかを判断するために、国レベルでさらに調査する必要があります。

これらの標準化されたテスト結果が、コミュニティおよび家族の要因によって高い精度で予測される場合、それは大きな政策上の意味を持つでしょう。 私の意見では、このようなテスト結果を使った政策基盤全体を捨てて、学校関係者や学生について重要な決定を下すべきだと考えています。 結局のところ、これらの要因は、学生や学校職員のコントロールの範囲外です。

標準化されたテスト結果のメリットについての理念的な争いがあるが、科学はより明確になっている。 この結果は、標準化されたテスト結果が、学生が学んだ金額や、学年中の学生の学業的、社会的、感情的な成長よりも、学生が生活する地域社会についてより詳しく説明することを示唆しています。

時間の経過と共にそれを受け入れたくない人もいるかもしれないが、 教師による評価 標準化されたテストよりも学生の達成度を示す良い指標です。 たとえば、高等学校のGPA(授業評価に基づく)は、SATよりも大学の初年度における学生の成功を予測する良い指標です。

会話この変更は、教師とはあまり関係のないテストスコアと比較して、効果的な教授に関する重要な情報を提供するための長い道のりになります。

著者について

クリストファー・ティエンケン(Christopher Tienken)教育リーダーシップ・マネジメント・ポリシー担当副教授は、 シートンホール大学

この記事は、最初に公開された 会話。 読む 原著.

この著者による書籍

at InnerSelfMarketとAmazon