1 Einleitung

Neben kognitiven und familiären Faktoren von Schülerinnen und Schülern gilt die Lehrperson als maßgebliche Einflussgröße für den Schulerfolg (z. B. Brühwiler und Helmke 2018). Rubie-Davies et al. (2018) heben das Potential der Leistungserwartung von Lehrpersonen für Lernprozesse der Schülerinnen und Schüler hervor. Bisherige Forschungen zum Einfluss von Leistungserwartungen auf die Schülerinnen- und Schülerleistung bestätigen immer wieder einen positiven Zusammenhang. Das Leistungspotential von Schülerinnen und Schülern wird besser ausgeschöpft, wenn Lehrpersonen hohe Leistungserwartungen an sie richten (s. Review von Wang et al. 2018). Andere Studien weisen aber auch darauf hin, dass im Vergleich zu anderen Lehrpersonenmerkmalen die Effektstärke der Leistungserwartung als eher gering eingeschätzt wird (z. B. Kunter und Pohlmann 2015). Insbesondere liegen kaum Studien vor, welche Erwartungseffekte unter der Kontrolle weiterer Lehrpersonenmerkmale testen (Ludwig 2010).

Ziel des vorliegenden Beitrags ist zunächst, den Zusammenhang zwischen der gemittelten Leistungserwartung von LehrpersonenFootnote 1 und ihrem Professionswissen (Mathematikwissen, mathematikdidaktisches Wissen sowie pädagogisch-psychologisches Wissen; Shulman 1987) empirisch zu prüfen. Anschließend soll der Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung im Fach Mathematik unter Kontrolle des Professionswissens getestet werden.

2 Theoretischer Hintergrund

2.1 Die Leistungserwartung von Lehrpersonen und ihr Zusammenhang mit dem Professionswissen

Die Leistungserwartung von Lehrpersonen an die Schülerinnen und Schüler kann als eine veränderbare Überzeugung verstanden werden, welche sich Lehrpersonen über die aktuelle sowie zukünftige Leistung ihrer Schülerinnen und Schüler bilden (Good und Brophy 1997; Rubie-Davies 2004). Reusser und Pauli (2014) sowie Kunter und Pohlmann (2015) ordnen die Leistungserwartung den personenbezogenen Überzeugungen bzw. den Überzeugungen über bestimmte Schülerinnen und Schüler zu. Die Veränderbarkeit bzw. Erlernbarkeit der Leistungserwartung konnte durch Interventionsstudien nachgewiesen werden (Fischer und Rustemeyer 2007; Rubie-Davies et al. 2015) und bekräftigt die Einordnung der Leistungserwartungen als ein Aspekt professioneller Kompetenz von Lehrpersonen.

In der Literatur werden aber auch gewisse Ähnlichkeiten mit der diagnostischen Kompetenz von Lehrpersonen diskutiert (Zhu et al. 2018). Zwar unterscheiden sich die theoretischen Konzeptionen der Leistungserwartung und der diagnostischen Kompetenz von Lehrpersonen, beide Ansätze verwenden jedoch zur Messung ihrer zentralen Konstrukte die Einschätzung von Schülerinnen- und Schülerleistungen durch die Lehrperson. Die Unterscheidung besteht darin, dass im Kontext der diagnostischen Kompetenz von Lehrpersonen die Fähigkeit erfasst wird, zu einem akkuraten Urteil über Merkmale von Lernenden, wie beispielsweise die Leistungen, zu gelangen (vgl. Schrader und Praetorius 2018). Die Leistungserwartung kann allerdings durch Beurteilungstendenzen und -fehler verzerrt sein. Aus dem verzerrten, bzw. inakkuraten Anteil der Leistungserwartung („Erwartungsbias“) kann eine selbsterfüllende Prophezeiung resultieren (Jussim et al. 2009; Gentrup und Rjosk 2018). Der soziale Hintergrund von Schülerinnen und Schülern hängt z. B. positiv mit der Leistungserwartung zusammen, was im Sinne der Chancengerechtigkeit durchaus kritisch diskutiert werden kann (Gentrup et al. 2018). Unter pädagogischen Gesichtspunkten wird im Sinne des Aufdeckens der Zone der proximalen Entwicklung (Vygotsky 1978) eine leichte Überschätzung der Schülerinnen- und Schülerleistung als günstiger für die Leistungsentwicklung angesehen als eine korrekte Einschätzung oder gar eine Unterschätzung (Timmermans et al. 2015). Eine leichte Überschätzung und deren mögliche positive Wirkung auf die Schülerinnen- und Schülerleistung wird im Kontext der diagnostischen Kompetenz unter dem Stichwort „diagnostischer Optimismus“ diskutiert (s. zusammenfassend Hesse und Latzko 2017).

Basierend auf den Überlegungen zum Erwartungsbias argumentieren Zhu et al. (2018), dass sich eine Einschätzung aktueller Leistungen als Indikator für die Leistungserwartung heranziehen lässt. Über den Residuen-Ansatz von Madon et al. (1997) kann der inakkurate Anteil dieser Einschätzung, im Sinne einer sich selbsterfüllenden Prophezeiung, bestimmt werden. Dieser Ansatz liegt dem vorliegenden Beitrag zugrunde und wird im methodischen Vorgehen detailliert beschrieben.

Inwieweit die Leistungserwartung von Lehrpersonen mit weiteren Lehrpersonenmerkmalen zusammenhängt, ist bis heute nur wenig untersucht (Ludwig 2010; Wang et al. 2018). Das Zusammenspiel unterschiedlicher Lehrpersonenmerkmale soll eine erfolgreiche Lehrperson bzw. ein erfolgreiches Unterrichtshandeln ausmachen und damit verbunden die Leistungsentwicklung der Schülerinnen und Schüler mitbestimmen (z. B. Baumert und Kunter 2006; Blömeke et al. 2008). Neben Wissenskomponenten sowie motivationalen Orientierungen wird auch den Überzeugungen, zu denen die Leistungserwartung gezählt werden kann (Reusser und Pauli 2014; Kunter und Pohlmann 2015), eine bedeutsame Rolle für die Qualität des Berufshandelns zugeschrieben. Überzeugungen beeinflussen und steuern die Auswahl von Zielen und Handlungsplänen, die Wahrnehmung und Deutung von Situationen sowie das didaktische und kommunikative Handeln und Problemlösen im Unterricht (vgl. u. a. Woolfolk Hoy et al. 2006; Philipp 2007; Reusser und Pauli 2014). Die Stärke des Zusammenhangs unterschiedlicher Merkmale wird in der Literatur kontrovers diskutiert (Oser und Blömeke 2012). Dies zeigt sich beispielsweise darin, dass einige Ansätze Überzeugungen dem Wissen zuordnen (Woolfolk Hoy et al. 2006) oder als überlappende Konstrukte betrachtet werden (Philipp 2007). Neuere theoretische und empirische Ansätze trennen die beiden Konstrukte Überzeugungen und Professionswissen deutlich voneinander (Kunter et al. 2011; Blömeke 2012). Da sowohl das Wissen einer Lehrperson als auch ihre Leistungserwartung im Sinne einer Überzeugung als kognitive Merkmale betrachtet werden können (Kunter und Pohlmann 2015), ist davon auszugehen, dass Wissens- und Erwartungskomponenten korrelieren. Erste empirische Ergebnisse konnten Zusammenhänge zwischen epistemologischen Überzeugungen und dem fachlichen sowie fachdidaktischen Wissen aufzeigen (s. zusammenfassend Reusser und Pauli 2014). Eine Erklärung hierfür ist, dass ein gewisses Maß an fachlichem und fachdidaktischen Wissen notwendig ist, um z. B. die dynamische Struktur der Mathematik zu erkennen (Blömeke 2012).

Nach Wang et al. (2018) ist es wichtig, dass sich Lehrpersonen über Vorurteile und Stereotypen gegenüber ihren Schülerinnen und Schülern bewusst sind, eine angemessene und hohe Erwartung, im Sinne der proximalen Entwicklung (Vygotsky 1978), an die Schülerinnen und Schüler stellen und sie durch das Bereitstellen einer optimalen Lernumgebung darin unterstützen ihr/sein Bestes zu geben. Um dies zu erreichen ist unter anderem ein hohes Professionswissen von Bedeutung, denn dies dürfte den Lehrpersonen helfen, eine reflektierte und differenzierte Meinung über die Leistungen der Schülerinnen und Schüler zu bilden, sich weniger von Vorurteilen oder Stereotypen leiten zu lassen und hohe Leistungserwartungen bewusst einzusetzen. Folglich kann angenommen werden, dass ein höheres Professionswissen mit einer hohen Leistungserwartung und damit verbunden einem anspruchsvolleren Unterricht einhergeht.

2.2 Der Einfluss der Leistungserwartung auf die Schülerinnen- und Schülerleistung

Die Forschung zu Erwartungseffekten im Unterricht nahm ihren Anfang mit dem Feldexperiment „Pygmalion in the classroom“ von Rosenthal und Jacobson (1968), im Sinne einer sich selbsterfüllenden Prophezeiung. In den letzten 50 Jahren wurden viele Studien durchgeführt, die mehrheitlich einen Effekt der Leistungserwartung auf die Schülerinnen- und Schülerleistung oder das Verhalten der Schülerinnen und Schüler nachweisen können (Wang et al. 2018). Trotzdem bleibt die Befundlage bis heute inkonsistent (vgl. z. B. Jussim und Harber 2005; Kunter und Pohlmann 2015; Wang et al. 2018). Im Vergleich zu anderen Lehrpersonenmerkmalen, wie beispielsweise dem Professionswissen, herrscht in der Pädagogischen Psychologie teilweise Skepsis gegenüber der Bedeutung der Leistungserwartung von Lehrpersonen für erfolgreiche Lernprozesse bei Schülerinnen und Schülern (Brophy und Good 1974; West und Anderson 1976; Brophy 1983; Kunter und Pohlmann 2015). Aufgrund unterschiedlicher Untersuchungsdesigns (z. B. Experimentalstudien vs. Interventionsstudien) mit einem unterschiedlichen Verständnis der Leistungserwartung (z. B. Erwartung an das Verhalten vs. Erwartung an die Leistung) (Claiborn 1969; Nash 1978; Fischer und Rustemeyer 2007; Rubie-Davies et al. 2015) und des gemessenen Outputs (z. B. Leistungstest vs. Note) (Jussim und Harber 2005; Friedrich et al. 2015) lassen sich kaum allgemein gültige Aussagen über die Konzeptualisierung, die praktische Relevanz oder die Stärke des Effekts der Leistungserwartung machen (Kunter und Pohlmann 2015). Bisherige Studien in diesem Feld weisen mit EffektstärkenFootnote 2 zwischen d = −0,09 und d = 0,78 die Wirkung der Leistungserwartung auf Schülerebene nach (Brophy und Good 1974; Rosenthal und Rubin 1978; Rubie-Davies 2004; Jussim und Harber 2005; Hattie 2013). Einer Schätzung von Brophy (1983) zufolge erklärt die Leistungserwartung von Lehrpersonen zwischen fünf und zehn Prozent der Gesamtvarianz der Schülerinnen- und Schülerleistung.

Die meisten Studien zum Effekt der Leistungserwartung von Lehrpersonen auf die Schülerinnen- und Schülerleistung kontrollieren soziodemographische Merkmale von Lehrpersonen sowie individuelle und kognitive Merkmale von Schülerinnen und Schülern (z. B. Ludwig 2010; Wang et al. 2018). Vor allem die familiären (z. B. soziale Herkunft) und kognitiven (z. B. Vorwissen) Schülerinnen- und Schülermerkmale zählen zu den stärksten Prädiktoren schulischer Leistung (s. zusammenfassend Brühwiler und Helmke 2018). Um Zusammenhänge zwischen der Leistungserwartung und der Schülerinnen- und Schülerleistung nicht fälschlicherweise zu überschätzen, sollten sowohl familiäre als auch kognitive Merkmale von Schülerinnen und Schülern kontrolliert werden (Wang et al. 2018).

Über den WirkungszusammenhangFootnote 3 zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung besteht weitgehend Einigkeit, obwohl es kaum empirische Untersuchungen gibt, die den theoretisch postulierten Wirkungszusammenhang im Gesamten empirisch geprüft haben (West und Anderson 1976; Babad 1990; Rubie-Davies 2009; Wang et al. 2018). Es wird davon ausgegangen, dass die Leistungserwartung von Lehrpersonen ihr Verhalten im Unterricht beeinflusst und so ihre Leistungserwartung gegenüber den Schülerinnen und Schülern offenbart. Den Schülerinnen und Schülern soll dieses unterschiedliche Verhalten auffallen, sodass sie es interpretieren und in ihr eigenes Selbstkonzept integrieren, was letztlich die Schülerinnen- und Schülerleistung beeinflusst (z. B. West und Anderson 1976; Harris und Rosenthal 1985; Babad 1990; McKown und Weinstein 2008; Dubs 2009; Ludwig 2010; Kunter und Pohlmann 2015).

Die eben beschriebenen Befunde beziehen sich auf die Wirkung der Leistungserwartung auf die einzelnen Schülerinnen und Schüler. Brophy (1983) vermutete, dass der Einfluss der durchschnittlichen Leistungserwartung bezogen auf die gesamte Klasse grösser sein muss im Vergleich zum Effekt auf die individuelle Schülerinnen- und Schülerleistung. Empirisch konnte diese Vermutung bis heute allerdings kaum nachgewiesen werden (Friedrich et al. 2015).

Wie eingangs erwähnt gelten Merkmale der Lehrperson im Allgemeinen sowie ihr Handeln im Unterricht als grundlegende Determinanten von Schülerinnen- und Schülerleistungen (vgl. Brühwiler und Helmke 2018). Allerdings hängt es vom zu betrachtenden Merkmal ab, als wie bedeutungsvoll es eingeschätzt wird. Während beispielsweise ein hinreichendes Maß an Professionswissen als wesentliche Voraussetzung für die Planung und Durchführung eines lernwirksamen Unterrichts gilt (Baumert und Kunter 2011) und dies mit ersten empirischen Studien bestätigt werden kann (Hill et al. 2005; Affolter et al. 2016; Lenske et al. 2016; Brühwiler et al. 2017), präsentiert sich die Forschungslage zur Bedeutung der Leistungserwartung von Lehrpersonen auf die Schülerinnen- und Schülerleistung als umstrittener und uneinheitlicher (vgl. z. B. Kunter und Pohlmann 2015; Wang et al. 2018).

2.3 Fragestellungen und Hypothesen

Wie aus den Abschn. 2.1 und 2.2 hervorgeht, wurden in bisherigen Studien zur Leistungserwartung selten mehrere Lehrpersonenmerkmale gleichzeitig berücksichtigt (Wang et al. 2018). Dementsprechend interessiert in der ersten Forschungsfrage der Zusammenhang zwischen der Leistungserwartung und dem Professionswissen von Lehrpersonen. Des Weiteren mangelt es an Studien zum Zusammenhang zwischen der Leistungserwartung und der Schülerinnen- und Schülerleistung unter Berücksichtigung weiterer Lehrpersonenmerkmale. Die zweite Forschungsfrage geht folglich diesem Zusammenhang nach. Konkret stehen folgende Fragestellungen im Interesse des vorliegenden Artikels:

Forschungsfrage 1

Hängt die durchschnittliche Leistungserwartung von Lehrpersonen mit ihrem Professionswissen (Mathematikwissen, mathematikdidaktisches Wissen, pädagogisch-psychologisches Wissen) zusammen?

Es wird ein positiver Zusammenhang vermutet, da anzunehmen ist, dass sich unterschiedliche kognitive Merkmale einer Lehrperson gegenseitig beeinflussen können (z. B. Baumert und Kunter 2006; Blömeke et al. 2008).

Forschungsfrage 2a

Besteht ein Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung?

Es wird davon ausgegangen, dass mit den vorliegenden Daten ein statistisch bedeutsamer, positiver Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Mathematikleistung der Schülerinnen und Schüler nachgewiesen werden kann. Das Leistungspotential von Schülerinnen und Schülern wird besser ausgeschöpft, wenn Lehrpersonen hohe Leistungserwartungen an sie richten (z. B. Gentrup und Rjosk 2018; Wang et al. 2018).

Forschungsfrage 2b

Gibt es unter Kontrolle des Professionswissens einen Zusammenhang zwischen der Leistungserwartung von Lehrpersonen mit der Schülerinnen- und Schülerleistung?

Es wird angenommen, dass die Leistungserwartung von Lehrpersonen auch unter Kontrolle ihres Professionswissens einen statistisch bedeutsamen Zusammenhang mit der Mathematikleistung der Schülerinnen und Schüler aufweist und zusätzliche Varianz in der Schülerinnen- und Schülerleistung erklärt. Letztlich macht nicht nur ein Lehrpersonenmerkmal, sondern erst das Zusammenspiel unterschiedlicher Merkmale eine erfolgreiche Lehrperson bzw. ein erfolgreiches Handeln dieser aus (Baumert und Kunter 2006; Klieme und Leutner 2006; Blömeke et al. 2008).

3 Methode

3.1 Stichprobe und Untersuchungsdesign

Die Datengrundlage stammt von der vom Schweizerischen Nationalfonds unterstützten Längsschnittstudie „Wirkungen der Lehrerausbildung auf professionelle Kompetenzen, Unterricht und Schülerleistung“ (WiL)Footnote 4. Im Rahmen der Studie wurden (angehende) Lehrpersonen der Primarstufe zu Beginn (2008) und am Ende des Studiums (2011) sowie zu Beginn (2013) und am Ende ihres dritten Berufsjahres (2014) befragt. Die Analysen des hier vorliegenden Beitrags beziehen jene Primarstufenlehrpersonen mit ein, die in ihrem dritten Berufsjahr mit ihren Klassen (3.–6. Klasse) an der Studie teilgenommen haben. Insgesamt liegen von 28 Primarlehrpersonen und ihren Klassen mit 509 Schülerinnen und Schülern (3. Klasse: n = 130; 4. Klasse: n = 71; 5. Klasse: n = 134; 6. Klasse: n = 174) vollständige Daten sowohl am Anfang als auch am Ende des Schuljahres vor. In der vorliegenden Stichprobe der Lehrpersonen beträgt der Frauenanteil 86,1 %, was dem durchschnittlichen Frauenanteil auf der Primarstufe in der Schweiz entspricht (Bundesamt für Statistik 2016). Im Durchschnitt unterrichten die befragten Lehrpersonen eine Klasse mit 18 Schülerinnen und Schülern mit einem Durchschnittsalter von M = 10,96 Jahre (SD = 1,31; Min. = 8,04; Max. = 13,56). Das Geschlechterverhältnis bei den Schülerinnen und Schülern ist ausgeglichen (50,3 % weiblich).

3.2 Erhebungsinstrumente

Unabhängige Variable

Die Leistungserwartung von Lehrpersonen wurde am Ende des Schuljahres erfasst (in Anlehnung an Good und Brophy 1997; Rubie-Davies 2004). In einem ersten Schritt wurden die Lehrpersonen gebeten, die von ihnen erwartete Punktzahl im eingesetzten Mathematiktest zu jeder Schülerin/jedem Schüler am Ende des Schuljahres vorherzusagen (Auftrag an die Lehrpersonen: „Bitte geben Sie an, welche Punktzahlen Sie von den Schülerinnen und Schülern im Mathematiktest erwarten.“). Der verwendete Mathematiktest (s. Beschreibung weiter unten) stand den Lehrpersonen während ihrer Punkteinschätzungen zur Verfügung. Die Punkteinschätzung liefert die Basis, um in einem zweiten Schritt den inakkuraten Anteil dieser Einschätzung zu ermitteln (Jussim et al. 2009; Gentrup und Rjosk 2018). Der inakkurate Anteil der Einschätzung wird über den Residuen-Ansatz von Madon et al. (1997) gebildet (in Anlehnung an Hinnant et al. 2009; Rubie-Davies und Peterson 2016). Die standardisierten Residuen der multiplen Regression zwischen der Punkteinschätzung von Lehrpersonen und Schülerinnen- und Schülermerkmalen (intrinsische Motivation, Selbstkonzept in Mathematik sowie Mathematikleistung zu Beginn des Schuljahres)Footnote 5 ergeben einen Indikator für die Leistungserwartung von Lehrpersonen im Sinne einer sich selbsterfüllenden Prophezeiung. Die standardisierten Residuen geben den Anteil der Punkteinschätzung der Lehrperson an, der nicht durch die oben genannten Merkmale der Schülerinnen und Schüler erklärt werden kann (Min = −3,25; Max. = 2,52). Positive Residuen deuten darauf hin, dass die Lehrperson eine höhere Leistung von der Schülerin/dem Schüler erwartet, als durch die Schülerinnen- und Schülermerkmale vorhergesagt werden kann. Negative Residuen hingegen deuten darauf hin, dass die Lehrperson von dieser Schülerin/diesem Schüler weniger erwartet, als durch die Schülerinnen- und Schülermerkmale vorhergesagt wird.

Abhängige Variable

Die Mathematikleistung der Schülerinnen und Schüler wurde zu Beginn und am Ende des Schuljahres über Teile eines in der Schweiz normierten Mathematiktests gemessen, welche klassenstufenspezifisch (3.–6. Klasse) konzipiert sind (Moser 2003). Die vier Tests haben einen starken Bezug zum Lehrplan der jeweiligen Klassenstufe und erfassen mit 30–70 Aufgaben Mathematikwissen in den Bereichen Arithmetik, Geometrie, Algebra, Sachrechnen und Stochastik. Vorteile des Tests sind, dass die Referenzwerte auf einer repräsentativen Stichprobe basieren und der soziale Vergleich innerhalb der Klassenstufe ein starker Bezugspunkt ist (Moser 2003). Die Tests wurden spezifisch für die jeweilige Klassenstufe konzipiert, so dass die Aufgaben altersgemäß formuliert sind. Das Risiko, dass Aufgaben aufgrund niedriger Lesekompetenz nicht beantwortet werden konnten, wurde somit möglichst gering gehalten. Die stufenspezifischen Tests verfügen jedoch über eine eigene Metrik, was einen Nachteil der Tests darstellt. Zum Zeitpunkt der Erhebung war kein Testverfahren bekannt, welches von der 3. bis zur 6. Klasse eingesetzt werden kann und eine gemeinsame Metrik besitzt. Aufgrund fehlender Ankeritems und der niedrigen Stichprobengröße innerhalb der Klassenstufen ist eine IRT-Skalierung nicht möglich. Um dennoch eine gemeinsame Metrik zu schaffen, wurden die Testwerte innerhalb der einzelnen Klassenstufen z‑standardisiert um sie anschließend über die Klassenstufen hinweg zusammenzufügen. Die standardisierte Variable drückt aus, wie eine Schülerin/ein Schüler bezogen auf die jeweilige Klassenstufe relativ zu den anderen Schüler/innen steht. Der Mittelwert zu Beginn des Schuljahres wurde auf 500 mit einer Standardabweichung von 100 transformiert. Am Ende des Schuljahres erreichten die Schülerinnen und Schüler im Durchschnitt M = 608 Punkte (SD = 123; min. = 350; max. = 892). Die interne Konsistenz der jeweiligen Tests ist mit einem Cronbachs Alpha von α > 0,67 zufriedenstellend.

Kontrollvariablen

Das Professionswissen der Lehrpersonen wurde mittels standardisierter Tests erfasst. Das Mathematikwissen sowie das mathematikdidaktische Wissen wurden mit den in der internationalen Vergleichsstudie TEDS‑M eingesetzten Messinstrumenten getestet (Tatto et al. 2012). Das Mathematikwissen wird mit 74 Items aus den Bereichen Arithmetik, Geometrie, Algebra sowie Daten und Wahrscheinlichkeit erhoben (M = 556; SD = 62,21; min. = 450; max. = 693). Die Testaufgaben haben zumeist einen Bezug zu den Inhalten der Primarstufe, umfassen aber auch Aufgaben des Sekundarstufe I Niveaus, nicht aber über das Abiturniveau hinaus. Das mathematikdidaktische Wissen beinhaltet Aufgaben zum curricularen, planungsbezogenen sowie interaktionsbezogenen Wissen und umfasst 32 Items (M = 550; SD = 67,72; min. = 420; max. = 702). Mittels des Partial Credit Modells wurden die Testergebnisse (getrennt nach Mathematikwissen und mathematikdidaktischem Wissen) analog zum internationalen Vorgehen IRT-skaliert (Masters 1982) und auf den internationalen Mittelwert von 500 mit einer Standardabweichung von 100 transformiert. Die Mittelwerte sind aufgrund der getrennten Skalierung nicht direkt miteinander vergleichbar. Sie lassen keine Rückschlüsse zu, ob die Lehrpersonen ein höheres Mathematikwissen oder mathematikdidaktisches Wissen haben. Im internationalen Vergleich liegen die Lehrpersonen in beiden Kompetenzbereichen eine halbe Standardabweichung über dem internationalen Mittelwert (Brühwiler et al. 2015a, 2015b).

Zur Messung des pädagogisch-psychologischen Wissens wurde ein im Rahmen des Projekts neu entwickeltes Messinstrument verwendet, welches unterrichtsrelevantes pädagogisch-psychologisches Handlungswissen (PPHW) in den Bereichen Attributionstheorie, Didaktik (Transfer, Repräsentationsformen), selbstreguliertes Lernen (Metakognition), Selbstkonzept, Problemlöseverhalten und Fehlerkultur erfasst (Brühwiler et al. 2017). Die Auswertung des Tests PPHW erfolgte über einen Vergleich mit einer Expertenlösung mittels Quasi-Paarvergleichen analog zum Würzburger Lesestrategie-Wissenstest (Schlagmüller und Schneider 2007). Die maximal zu erreichende Punktzahl bei 27 Items beträgt 54 Punkte. Im Durchschnitt erreichten die Lehrpersonen M = 46,11 Punkte (SD = 3,83; min. = 33; max. = 51). Die interne Konsistenz ist zufriedenstellend (Cronbachs α = 0,76).

Neben dem Professionswissen werden weitere für den Schulerfolg bedeutende Einflussgrößen kontrolliert. Der Index zur sozialen Herkunft besteht aus den beiden Indikatoren höchster Schul- bzw. Bildungsabschluss der Eltern sowie dem Besitz von Büchern, was eine Kurzform des in PISA breit erfassten ESCS darstellt und mit diesem (zumindest in Schweizer Daten) hoch korreliert (r > 0,90). Der höchste Schulabschluss der Eltern wurde über die sechsstufige International Standard Classification of Education (ISCED) erfasst. Der Besitz von Büchern, einem Aspekt des kulturellen Kapitals, wurde über die Anzahl Bücher zu Hause (mit sechs Antwortkategorien von 1 = „0 bis 10 Bücher“ bis 6 = „mehr als 500 Bücher“) erhoben. Der Index zur sozialen Herkunft ist mittels Hauptkomponentenanalyse gebildet und z‑standardisiert worden (für die vorliegende Stichprobe: M = 0,12; SD = 0,81). Zudem wird das Vorwissen der Schülerinnen und Schüler kontrolliert, welches durch den vorab beschriebenen Mathematiktest zu Beginn des Schuljahres erhoben wurde.

3.2.1 Datenanalyse

Zur Beantwortung der Forschungsfragen wurden Mehrebenenanalysen in Mplus 8.0 durchgeführt (Muthén und Muthén 2017). In den vorliegenden Daten wurde die hierarchisch geschachtelte Datenstruktur berücksichtigt, da die Intraklassenkorrelation (ICC1) der Mathematikleistung der Schülerinnen und Schüler mit 0,15 den kritischen Wert von 10 % überschreitet (Lüdtke et al. 2009). Die Stichprobengröße auf Klassenebene entspricht zwar mit N = 28 nur knapp der unteren Grenze für eine Verwendung von Mehrebenenanalysen (N = 30; Maas und Hox 2005). Mit Hilfe der Berücksichtigung der Mehrebenenstruktur kann die Alpha-Fehlerrate möglichst klein gehalten (Geiser 2011) und somit der Kritik an einer möglichen Überschätzung des Effekts (Cohen et al. 2013) entgegengewirkt werden.

Die Korrelation zwischen der Leistungserwartung und dem Professionswissen wurde auf der Klassenebene berechnet, wobei die Varianz der Leistungserwartung auf der Schülerebene frei geschätzt wurde (Forschungsfrage 1). Der Zusammenhang der Leistungserwartung von Lehrpersonen mit der Schülerinnen- und Schülerleistung auch unter Kontrolle des Professionswissens und weiterer Schülerinnen- und Schülermerkmale wurde mittels Random-Intercept-Modellen (Heck und Thomas 2015) geprüft (Forschungsfragen 2a & 2b). Auf der Klassenebene gibt es keine fehlenden Werte. Um einzelne fehlende Werte der Schülerinnen und Schüler in die Analysen miteinzubeziehen, wurden die Analysen mit der full information maximum likelihood (FIML) Methode durchgeführt.

4 Ergebnisse

4.1 Zusammenhang zwischen der durchschnittlichen Leistungserwartung und dem Professionswissen von Lehrpersonen

Zur Berechnung des Zusammenhangs zwischen der durchschnittlichen Leistungserwartung und den einzelnen Bereichen des Professionswissens von Lehrpersonen wurde unter Berücksichtigung der Mehrebenenstruktur die Korrelation dieser Merkmale berechnet (s. Tab. 1).

Tab. 1 Korrelationsmatrix zwischen der durchschnittlichen Leistungserwartung, dem Mathematikwissen, dem mathematikdidaktischen Wissen und dem pädagogisch-psychologischen Wissen

Die durchschnittliche Leistungserwartung hängt mit keinem der untersuchten Bereiche des Professionswissens signifikant zusammen. Das Mathematikwissen und das mathematikdidaktische Wissen korrelieren statistisch bedeutsam (r = 0,41; p = 0,001).

4.2 Zusammenhang zwischen der Leistungserwartung von Lehrpersonen mit der Leistung von Schülerinnen und Schülern

Um den Zusammenhang der Leistungserwartung von Lehrpersonen mit der Schülerinnen- und Schülerleistung (auch unter Kontrolle des Professionswissens) zu prüfen, wurden sechs Mehrebenenmodelle spezifiziert (s. Tab. 2). Gemäß der ICC1 sind 15 % der Varianz in der Mathematikleistung der Schülerinnen und Schüler auf Unterschiede zwischen den Klassen zurückzuführen.Footnote 6 Die Leistungserwartung von Lehrpersonen korreliert mit der Mathematikleistung zu Beginn des Schuljahres (r = 0,28; p < 0,001) und der sozialen Herkunft (r = 0,29; p < 0,001) statistisch bedeutsam. Die Gefahr einer Verzerrung der Ergebnisse aufgrund von Multikollinearität zwischen den Prädiktoren ist als gering zu beurteilen (Toleranzwert ≥90 %; VIF ≤5,0).

Tab. 2 Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung in Mathematik am Ende des Schuljahres

Im ersten Modell in Tab. 2 (M1) sind auf der Schüler- und der Klassenebene die Mathematikleistung zu Beginn des Schuljahres sowie die soziale Herkunft der Schülerinnen und Schüler als Prädiktoren aufgenommen. Die Ergebnisse zeigen, dass die Mathematikleistung der Schülerinnen und Schüler zu Schuljahresbeginn einen starken Prädiktor für die Mathematikleistung am Schuljahresende darstellt (β = 0,74, p < 0,001). Die soziale Herkunft hat einen deutlich schwächeren, aber ebenfalls positiven Effekt auf die Leistung (β = 0,10, p = 0,001). Auf der Schülerebene kann mit diesen beiden Prädiktoren 59 % der Varianz der Mathematikleistung am Schuljahresende erklärt werden. Auf der Klassenebene sind die durchschnittliche Mathematikleistung der Klasse zu Beginn des Schuljahres (β = 0,92, p < 0,001) sowie die mittlere soziale Herkunft (β = 0,36, p = 0,015) starke Prädiktoren für die durchschnittliche Mathematikleistung am Schuljahresende. Sie erklären zusammen 96 % der Varianz in der Mathematikleistung auf Klassenebene.

Im Modell 2 (M2) wird deutlich, dass nicht nur die Mathematikleistung der Schülerinnen und Schüler zu Beginn des Schuljahres sowie die soziale Herkunft die Mathematikleistung am Ende des Schuljahres vorhersagen, sondern auch die Leistungserwartung von Lehrpersonen (β = 0,31, p < 0,001). Durch die Aufnahme der Leistungserwartung in das Modell werden zusätzlich 9 % Varianz auf der Schülerebene aufgeklärt, was nach Cohen einen mittleren Effekt darstellt (Cohens f2 = 0,281; Cohen 1988). In den Modellen 3 bis 5 (M3–M5) wird zusätzlich jeweils ein Bereich des Professionswissens berücksichtigtFootnote 7. Das Mathematikwissen (M3: β = 0,17, p = 0,008) sowie das pädagogisch-psychologische Wissen (M5: β = 0,25, p = 0,001) der Primarlehrpersonen hängen statistisch bedeutsam mit der Schülerinnen- und Schülerleistung am Ende des Schuljahres zusammen. Kein signifikanter Zusammenhang mit der Schülerinnen- und Schülerleistung besteht für das mathematikdidaktische Wissen (M4: β = 0,10, p = 0,227). Der Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung bleibt auch unter Kontrolle des Professionswissens bestehen (M3–M5). Werden alle drei Facetten des Professionswissens gleichzeitig im Modell berücksichtigt (M6), bleiben die statistisch bedeutsamen Zusammenhänge der Leistungserwartung von Lehrpersonen, ihrem Mathematikwissen sowie ihrem pädagogisch-psychologischen Wissen mit der Schülerinnen- und Schülerleistung bestehen.

Zusammenfassend ist festzuhalten, dass die Leistungserwartung von Lehrpersonen auch unter Kontrolle ihres Professionswissens mit der Schülerinnen- und Schülerleistung statistisch bedeutsam zusammenhängt. Neben der Leistungserwartung zeigen das Mathematikwissen und das pädagogisch-psychologische Wissen einen positiven Zusammenhang mit der Schülerinnen- und Schülerleistung. Die soziale Herkunft der Schülerinnen und Schüler verliert an statistischer Bedeutsamkeit, wenn die Leistungserwartung von Lehrpersonen in das Modell aufgenommen wird. Die Ergebnisse zeigen, dass die Schülerinnen und Schüler, die bereits zu Beginn des Schuljahres hohe Leistungen aufweisen, auch am Ende des Schuljahres im Fach Mathematik besonders gut sind. Erweiternd hierzu wird deutlich, dass Schülerinnen und Schüler (unabhängig von ihrer sozialen Herkunft) am Ende des Schuljahres bessere Mathematikleistungen zeigen, wenn ihre Lehrpersonen eine hohe Leistungserwartung, ein hohes Mathematikwissen sowie ein hohes pädagogisch-psychologisches Wissen besitzen.

5 Diskussion

5.1 Beantwortung der Forschungsfragen

Im Fokus dieser Studie stehen die Zusammenhänge der (durchschnittlichen) Leistungserwartung von Lehrpersonen mit ihrem Professionswissen (Mathematikwissen, mathematikdidaktisches Wissen und pädagogisch-psychologisches Wissen) sowie mit der Mathematikleistung von Schülerinnen und Schülern.

Forschungsfrage 1 fokussiert den Zusammenhang zwischen der durchschnittlichen Leistungserwartung von Lehrpersonen und ihrem Professionswissen. In den Daten zeigt sich wider Erwarten kein signifikanter Zusammenhang zwischen der durchschnittlichen Leistungserwartung von Lehrpersonen und den drei untersuchten Bereichen des Professionswissens. Dieser Befund bestärkt die Annahme, dass die Konstrukte Wissen und Überzeugung als separate Konstrukte zu betrachten sind (Kunter et al. 2011; Blömeke 2012). Nicht auszuschließen ist jedoch, dass der nicht signifikante Zusammenhang in der Operationalisierung der Konstrukte begründet liegt. Zum Beispiel wäre ein Zusammenhang mit dem pädagogisch-psychologischen Wissen möglicherweise nachzuweisen, wenn in einem Test Aspekte erfasst werden, die inhaltlich näher an den von Rubie-Davies (2014) herauskristallisierten Verhaltensweisen (z. B. Unterstützung im Lernprozess, lernrelevantes Feedback) liegen. Ebenso darf nicht unberücksichtigt bleiben, dass die hier erfasste Leistungserwartung den inakkuraten, individuellen Anteil der Lehrpersoneneinschätzung widerspiegelt. Diese verzerrte Leistungserwartung steht womöglich stärker mit anderen pädagogischen Überzeugungen in Zusammenhang (vgl. Wang et al. 2018) und weniger mit dem Professionswissen. Letzteres würde vermutlich stärker mit einer akkuraten Einschätzung im Sinne der diagnostischen Kompetenz zusammenhängen. Weitere Untersuchungen zum Zusammenhang unterschiedlicher Lehrpersonenmerkmale sind notwendig, um Kenntnisse darüber zu gewinnen.

Im Fokus der zweiten Fragestellung liegt der Zusammenhang der Leistungserwartung mit der Schülerinnen- und Schülerleistung (Forschungsfrage 2a) und das Bestehen dieses Zusammenhangs auch unter Kontrolle des Professionswissens (Forschungsfrage 2b). Die Ergebnisse gehen einher mit bestehenden Erkenntnissen aus Studien zur Wirkung der Leistungserwartung (z. B. Rosenthal und Rubin 1978; Jussim und Harber 2005; Friedrich et al. 2015; Rubie-Davies et al. 2015). Erwartungsgemäß wird ein positiver Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung in Mathematik deutlich. Dieses Ergebnis unterstützt die Annahme, dass sich eine gewisse Überschätzung positiv auf die Schülerinnen- und Schülerleistung auswirkt (Timmermans et al. 2015). Wenn das Professionswissen in das Modell mit aufgenommen wird, verliert die Leistungserwartung nicht an Bedeutung, obwohl das Mathematikwissen sowie das pädagogisch-psychologische Wissen ebenfalls positiv mit der Schülerinnen- und Schülerleistung in Zusammenhang stehen. Das mathematikdidaktische Wissen zeigt hingegen keinen signifikanten Zusammenhang mit der Schulleistung im Fach Mathematik.

Die Ergebnisse bestätigen die große Bedeutung des Vorwissens bzw. der Vortestleistung für schulisches Lernen (Hattie 2013). In den vorliegenden Daten wird durch das Vorwissen sowohl auf der Schüler- als auch auf der Klassenebene am meisten Varianz in der Mathematikleistung am Ende des Schuljahres erklärt. Erwähnenswert ist, dass die soziale Herkunft der Schülerinnen und Schüler nicht mehr statistisch signifikant mit deren Mathematikleistung zusammenhängt, wenn die Leistungserwartung von Lehrpersonen in die Modelle aufgenommen wird. Dieses Ergebnis deutet darauf hin, dass eine hohe Leistungserwartung von Lehrpersonen zu einer Reduktion des Zusammenhangs der sozialen Herkunft mit dem Lernerfolg der Schülerinnen und Schüler beitragen kann. Dies würde die Bedeutung der Leistungserwartung nicht nur für das schulische Lernen von Schülerinnen und Schülern betonen (Wang et al. 2018), sondern auch einen möglichen Ansatzpunkt liefern, um den Zusammenhang zwischen sozialer Herkunft und Lernerfolg etwas zu entkoppeln und somit einer Verfestigung von Bildungsungleichheiten entgegenzuwirken.

5.2 Stärken und Limitationen der Studie

Die empirische Überprüfung der Zusammenhänge zwischen Leistungserwartung von Lehrpersonen und den Leistungen der Schülerinnen und Schüler unter Kontrolle des Professionswissens erweitert bisherige Erkenntnisse aus Studien zum Erwartungseffekt, in denen Wissenskomponenten weitgehend unberücksichtigt blieben (Ludwig 2010). Die gemeinsame Betrachtung von Erwartungs- und Wissenskomponenten von Lehrpersonen, ist als Stärke der Studie zu sehen (vgl. Blömeke et al. 2015). Mit der Berücksichtigung von drei Kompetenzbereichen des Professionswissens (Mathematikwissen, mathematikdidaktisches und pädagogisch-psychologisches Wissen) wird zudem ein breites Spektrum des Professionswissens kontrolliert. Durch die Berücksichtigung der hierarchischen Datenstruktur kann ferner die Gefahr einer Überschätzung der Effekte der Leistungserwartung verringert werden (Cohen et al. 2013).

Es müssen für die vorliegende Untersuchung aber auch einige Limitationen genannt werden. Die Ergebnisse beruhen auf einer kleinen Stichprobe auf Klassenebene (N = 28). Des Weiteren lassen die querschnittlichen Daten keine empirische Absicherung zu kausalen Zusammenhängen und auf die Leistungsentwicklung zu. Die Ergebnisse können darüber hinaus nicht ohne weiteres auf andere Schulstufen, andere Fächer oder andere Regionen übertragen werden. Die Datengrundlage stammt aus Primarschulklassen in der Deutschschweiz und fokussiert das Fach Mathematik. Aus bestehenden Studien wird der Leistungserwartung von Lehrpersonen vor allem bei jüngeren Kindern (vgl. z. B. Jussim et al. 1998; Dubs 2009) sowie im Fach Mathematik eine besondere Wirksamkeit zugesprochen (Rubie-Davies et al. 2015). Weitere Limitationen sind bezüglich der Operationalisierung zweier Konstrukte zu machen, die im Folgenden weiter ausgeführt werden. Erstens wurde die Leistungserwartung von Lehrpersonen in der vorliegenden Studie am Ende des Schuljahres erhoben, was in der Forschungsliteratur zu Lehrpersonenerwartungen eine mögliche Operationalisierungsvariante darstellt (Zhu et al. 2018). Empirische Untersuchungen zeigen, dass sich die durchschnittliche Leistungserwartung von Lehrpersonen auch über drei Jahre hinweg nicht bedeutsam verändert (Rubie-Davies et al. 2018). Folglich kann davon ausgegangen werden, dass die Leistungserwartung zu Beginn des Schuljahres mit der Leistungserwartung am Ende des Schuljahres hoch korreliert und zu ähnlichen Ergebnissen führen würde. Empirisch kann dies allerdings mit dem vorliegenden Datensatz nicht geprüft werden. Die Leistungserwartung wurde in dieser Studie nach dem Residuen-Ansatz von Madon et al. (1997) erfasst. Mit diesem Ansatz wird die Höhe der Leistungserwartung in Relation zum tatsächlichen Leistungsstand betrachtet. Die Ergebnisse verweisen darauf, dass eine im Vergleich zur effektiven Leistung, hohe Leistungserwartung positiv mit der Leistung im Fach Mathematik zusammenhängt. Keine Aussage lässt sich darüber machen, ob eine zu hohe Leistungserwartung die Leistungen der Schülerinnen und Schüler auch negativ beeinflussen kann. Theoretische Annahmen lassen die Vermutung zu, dass die Leistungserwartung dann unrealistisch hoch ist, wenn sie nicht mehr der Zone der nächsten Entwicklung (Vygotsky 1978) entspricht und die Schülerinnen und Schüler eher überfordert anstatt sie zu fordern. Um die Leistungserwartung bewusst in der Zone der nächsten Entwicklung ansetzen zu können, ist die Urteilsakkuratheit von besonderer Bedeutung.

Eine zweite Limitation im Zusammenhang mit der Operationalisierung der Konstrukte betrifft jene der Mathematikleistung. Die eingesetzten Tests zur Erfassung des Leistungsstands der Schülerinnen und Schüler in Mathematik verfügen je über eine eigene Metrik. Auch wenn mittels z‑Standardisierung innerhalb der Klassenstufe, die Daten zu einer Variable zusammengeführt wurden (s. Abschn. 4.2), sollten künftige Forschungsvorhaben für alle Schülerinnen und Schüler denselben Test verwenden (was jedoch über eine größere Altersspanne nicht realisierbar ist) oder ein Testdesign einsetzen, das über Ankeritems eine gemeinsame (IRT-)Skalierung zulässt. Ein Vorteil der stufenangepassten Tests liegt aber darin, dass Verzerrungen aufgrund unangemessener Aufgabenformulierungen besser vermieden werden können. Zudem messen die Tests das mathematische Wissen relativ breit und mit einem starken Bezug zum Lehrplan der jeweiligen Stufe.

5.3 Bedeutung für die Praxis und Ausblick

Der positive Zusammenhang sowohl von der Leistungserwartung als auch des Mathematikwissens und des pädagogisch-psychologischen Wissens mit der Schülerinnen- und Schülerleistung verweist auf die Bedeutung der gemeinsamen Berücksichtigung unterschiedlicher Lehrpersonenmerkmale für erfolgreiche Lernprozesse (Blömeke et al. 2015). Solche Studien können zum besseren Verständnis von schulischen Lehr-Lernprozessen beitragen, erfordern aber anspruchsvolle Untersuchungsanlagen (z. B. bezüglich Datenstruktur, Stichprobenumfängen und Analysemethoden).

Der gefundene positive Zusammenhang zwischen der Leistungserwartung von Lehrpersonen und der Schülerinnen- und Schülerleistung ist für die Lehrerausbildung und die Berufspraxis insofern bedeutend, da sich die Frage stellt, inwiefern in der Aus- und Weiterbildung von Lehrpersonen neben dem Professionswissen auch die Leistungserwartung einer Lehrperson thematisiert werden sollte. Interventionsstudien zeigen, dass Lehrpersonen ein Verhalten erlernen können, welches jenem von Lehrpersonen mit einer hohen Leistungserwartung ähnlich ist und dieses erlernte Verhalten die Leistung von Schülerinnen und Schülern zumindest im Fach Mathematik positiv beeinflussen kann (Fischer und Rustemeyer 2007; Rubie-Davies et al. 2015). Die vorliegenden Ergebnisse liefern, wenn auch mit einigen Einschränkungen, wichtige Hinweise für die bedeutende Rolle von Lehrpersonen. Künftige empirische Untersuchungen sollten nicht nur verschiedene Lehrpersonenmerkmale gleichzeitig berücksichtigen, sondern auch Unterrichts- und Lernprozesse mit in den Blick nehmen, um so die komplexen Wirkmechanismen von Lehrererwartungen besser verstehen und empirisch absichern zu können.