1 Einleitung

Das aktuelle Bemühen um eine gelingende Lehrkräftebildung misst der Entwicklung von Reflexionskompetenz hohe Relevanz bei, weist sie sogar als Königsweg zur Expertiseentwicklung aus (Gruber 2021). Dabei wird die Forderung nach der Steigerung reflexiver Aktivitäten in der Lehrkräfteprofessionalisierung durchaus kritisch hinterfragt, zum einen wegen der damit verbundenen umfangreichen Erwartungen, zum anderen aber auch wegen der möglichen Nebenwirkungen, die gerade eine didaktisch induzierte Reflexionsforderung mit sich bringt (Häcker 2017). Das Fazit aus verschiedenen Überblicksarbeiten unterstreicht die Problematik: Obwohl Einigkeit darüber herrscht, dass Reflexion für die Ausbildung von Lehrkräften zentral ist, existiert eine große Bandbreite von Schwerpunktsetzungen, beispielsweise bezogen auf die Fragen, worauf sich Reflexion genau richtet und welche Prozesse adressiert sind (Beauchamp 2006; Clarà 2015), wie sie erfasst wird (Collin et al. 2013) und auch, welchen Stellenwert Reflexion für das Unterrichten und die professionelle Entwicklung einnimmt (Beauchamp 2015). Wir beziehen uns auf das Rahmenmodell zur Reflexion von Aeppli und Lötscher (2016), das verschiedene Ansätze und Konzepte integriert und damit reflexive Prozesse sicht- und analysierbar macht. Hier fokussieren wir auf einen Aspekt von Reflexion, der mit der Perspektive einer evidenzorientierten Lehrkräftebildung (Stark 2017) räsoniert, und befassen uns mit der reflexiven Auseinandersetzung mit wissenschaftlichen Wissensbeständen zur Erklärung pädagogischer Situationen. Dieser gewählte Fokus stellt eine zentrale Lernaufgabe für Praxisphasen an der Schnittstelle zwischen universitärer Wissensvermittlung und praktischer schulischer Tätigkeit sowie für die gesamte Professionalisierung im Lehrkraftberuf dar (Cramer et al. 2019; König et al. 2014). Ausgehend von aktueller Forschungsliteratur zur Evidenzorientierung (Barnes et al. 2020; Csanadi et al. 2021) nehmen wir zwei Aspekte in den Blick: (a) das Ausmaß, in dem auf wissenschaftliches Wissen zurückgegriffen wird und (b) die konkreten reflexiven Prozesse, in denen sich eine solche Auseinandersetzung vollzieht und anhand derer sich Qualitätsausprägungen im Umgang mit wissenschaftlichen Wissensbeständen erkennen lassen. Zusätzlich gehen wir der Frage nach der Aktivierung und Unterstützung einer solchen Auseinandersetzung nach. Im vorliegenden Beitrag untersuchen wir Effekte von Prompts und leitfadengestütztem Feedback, indem wir Studierende in einem cluster-randomisierten Design miteinander vergleichen.

2 Reflexion in der Lehrkräftebildung

Die Reflexion von pädagogischen Situationen stellt eine Lerngelegenheit dar, die die Entwicklung professioneller – evidenzorientierter – Praxis vorbereitet und anbahnt (z. B. Cramer et al. 2019; König et al. 2014; Schneider Kavanagh et al. 2020). Dabei wenden Lehrkräfte ihr Wissen an, wenn sie pädagogische Situationen beobachten, aus der Situation heraustreten und in der Nachbetrachtung die beobachtete Situation einordnen, interpretieren und Schlüsse ziehen. Diese Auseinandersetzung in der Nachbetrachtung (reflection-on-action, Schön 1983) findet zumeist in den Analysephasen von Reflexion (z. B. ALACT-Modell, Korthagen und Wubbels 2002) statt, wenn kritische Aspekte einer Situation herausgearbeitet werden, die den Rückgriff auch auf wissenschaftliche Wissensbestände notwendig machen (Schellenbach-Zell 2022). Gerade hier vollzieht sich folglich eine Verbindung zwischen wissenschaftlichem Wissen und schulischer Praxis, eines der wesentlichen Lernziele von Praxisphasen der Lehrkräfteausbildung (König et al. 2014). Leonhard et al. (2010, S. 114) definieren Reflexionskompetenz entsprechend als „die Fähigkeit, in der Vergegenwärtigung typischer Situationen des schulischen Alltags durch aktive Distanzierung eine eigene Bewertung und Haltung sowie Handlungsperspektiven auf der Basis eigener Erfahrung in Auseinandersetzung mit wissenschaftlichen Wissensbeständen argumentativ zu entwickeln und zu artikulieren“.

Offen bleibt die Frage, über welche wissenschaftlichen Wissensbestände Studierende in Praxisphasen im fortgeschrittenen Studium tatsächlich verfügen, und auch, ob sie korrekt und vollständig kognitiv repräsentiert sind, um auf pädagogische Situationen angewendet werden zu können (Patry 2014). Csanadi et al. (2021) unterscheiden darüber hinaus zwischen einer inhaltsbezogenen und einer prozessbezogenen Analysedimension. So können Studierende auf der inhaltlichen Ebene verschiedene Themen zur Erklärung einer pädagogischen Situation anführen und diese unter Verwendung von Theorien untermauern. Auf der Prozessebene setzen Studierende auf der Grundlage ihres Wissens verschiedene epistemische Prozesse (vgl. auch Barnes et al. 2020) ein, um ein erweitertes Verständnis der pädagogischen Situation zu erlangen.

2.1 Inhaltsbezogene Auseinandersetzung mit pädagogischen Situationen

Wenn sich Studierende mit einer pädagogischen Situation auseinandersetzen, adressieren sie verschiedene thematische Perspektiven (z. B. das motivationale Geschehen in einer Unterrichtssituation). Denkbar ist, dass Studierende eine thematische Perspektive einnehmen und diese – je nach Ausprägung und Struktur des Vorwissens – mit wissenschaftlichem Wissen anreichern. Dabei werden die Wahl und die Nutzung von wissenschaftlichem Wissen von verschiedenen personalen Faktoren beeinflusst, z. B. von Überzeugungen zur Nützlichkeit (z. B. Joram et al. 2020). Aktuelle Studien stellen Nützlichkeitsüberzeugungen als relevant für die tatsächliche Nutzung von wissenschaftlichen Erkenntnissen heraus (Greisel et al. 2022; Kiemer und Kollar 2021). Studien zur Theorieverwendung zeigen, dass Studierende auf wissenschaftliches Wissen zurückgreifen und es auf eine zu analysierende pädagogische Situation übertragen können (Csanadi et al. 2021; Schellenbach-Zell 2022). Sie greifen signifikant häufiger auf wissenschaftliche als auf subjektive Theorien zurück, wenn sie Kommiliton*innen Feedback zu deren professionellem Handeln geben sollen (Kiemer und Kollar 2021). Allerdings zeigt sich auch, dass die Theorieverwendung oftmals oberflächlich bleibt (Sampson und Blanchard 2012; Stark et al. 2009). Die tiefe Verarbeitung von Informationen auch aus verschiedenen Quellen ist jedoch für den Aufbau eines angemessenen mentalen Modells zum Sachverhalt wesentlich (Britt et al. 1999). So zeigen Hartmann et al. (2021) an einer Stichprobe von Lehramtsstudierenden, dass die Nutzung von vernetztem wissenschaftlichen Wissen aus verschiedenen Quellen mit qualitativ hochwertigeren Schlussfolgerungen für die Praxis einhergeht.

2.2 Prozessbezogene Auseinandersetzung mit pädagogischen Situationen

Reflexion vollzieht sich über den Einsatz von verschiedenen Prozessen (z. B. analysieren, verstehen, konstruieren, evaluieren, u. a.) mit unterschiedlichen Reflexionsgegenständen (Erfahrungen, sozialem Wissen, Theorien, Bedeutungen u. a.) und unterschiedlichen Zielen (z. B. Handlungen und Entscheidungen zu verbessern) (Beauchamp 2006). In ihrer umfassenden Zusammenschau ordnen Aeppli und Lötscher (2016) Prozesse aus verschiedenen Modellen zwei Reflexionsphasen zu, die im vorliegenden Beitrag im Vordergrund stehen: (1) Die Phase Analysieren – vertiefte Auseinandersetzung umfasst zum einen die Interpretation einer Situation als Konstruktion von Bedeutung über die Herstellung und Prüfung von Zusammenhängen: zwischen Elementen der Erfahrung und weiteren Elementen dieser oder anderer Erfahrungen, aber auch des eigenen Wissens oder des Wissens anderer (Rodgers 2002). Zum anderen fallen in diese Phase auch Prozesse, in denen auf Theorien und Befunde zurückgegriffen wird, die die Deutung von Situationen informieren und unterstützen können. (2) Die Phase Maßnahmen entwickeln, planen beschreibt eine zukunftsgerichtete, handlungsorientierte Reflexionsphase mit zwei wesentlichen Prozessen: Zum einen werden begründete Handlungsmöglichkeiten für die reflektierte Situation entwickelt, zum anderen ist das zukünftige eigene Handeln adressiert im Sinne einer anticipatory reflection (Conway 2001; van Manen 1995). Gerade diese Bezüge zum Selbst im Hinblick auf die professionelle Entwicklung werden als wesentliche Aspekte von Reflexion in der aktuellen Literatur herausgehoben (Beauchamp 2015).

Studierende können sich darin unterscheiden, in welcher Weise sie das eigene Wissen mit der zu analysierenden Situation in Zusammenhang bringen. Damit ist die Frage der Qualität von Reflexionsprozessen angesprochen. Eine Idealvorstellung dazu entwickeln Cramer et al. (2019) mit ihrem Konzept der Meta-Reflexivität, d. h. der „Kenntnis unterschiedlicher, auf den Lehrerinnen- und Lehrerberuf bezogener theoretischer Zugänge und empirischer Befunde, die Fähigkeit, diese mit Blick auf ihre jeweiligen Grundlagen und Geltungsansprüche verorten, in ein Verhältnis setzen und sich kritisch mit ihnen auseinandersetzen zu können sowie exemplarisch-typisierende Situationsdeutungen des komplexen Handlungsfeldes Schule vornehmen zu können“ (S. 410). Meta-Reflexivität spiegelt sich in der Bewusstheit, dass Theorie nicht linear auf Praxis bezogen werden kann. Pädagogische Situationen sind in der Regel komplexe Interaktionsgefüge, in denen verschiedene Rahmenbedingungen und pädagogische Ziele miteinander zusammenhängen und oftmals auch in Konflikt miteinander stehen (Cochran-Smith et al. 2014). In der Auseinandersetzung mit pädagogischen Situationen sind unterschiedliche Grade denkbar, von einer schematischen und linearen Übertragung hin zu einem abwägenden Modus, der die Einzigartigkeit von Situationen anerkennt und damit eine Übertragbarkeit und Passung von generalisierenden Theorien auf den Einzelfall der Situation reflektiert. Artmann et al. (2013) verwenden hierfür die Begrifflichkeiten eines schließenden vs. abwägenden Modus. Hartmann et al. (2021) unterscheiden zwischen Ausprägungen höherer und geringerer Reflexivität bei der Analyse von pädagogischen Situationen.

3 Anregung von Reflexion

3.1 Lerntagebücher und reflexionsbezogene Prompts

Die Formate zur Anregung tiefergehender Lernprozesse können vielfältig sein (vgl. Gläser-Zikuda und Hascher 2007). Lerntagebücher stellen eine typische Methode für die Begleitung von Praxisphasen dar und können Studierende bei der Entwicklung von Reflexivität zur Verknüpfung von Theorie und Praxis unterstützen (Lindroth 2015). Erhalten Studierende dabei keine zusätzliche Unterstützung, so bleiben die Ausführungen vorwiegend auf der beschreibenden Ebene (Hatton und Smith 1995; Hübner et al. 2007). Unterstützung bieten z. B. problem- und instruktionsorientierte Lernumgebungen beim Rückgriff auf Theorien zur Erklärung von schulischen Situationen (Klein et al. 2015, 2017). Damit Lerntagebücher also Effekte erzielen, brauchen sie weitergehende Strukturierung. Wir argumentieren für den Einsatz von reflexionsbezogenen Prompts im Sinne der Forschung zum selbstgesteuerten Lernen, d. h. von Aktivatoren für produktive Lernprozesse in Form von Hinweisen und Fragen (Hascher 2010; Hübner et al. 2007; Reigeluth und Stein 1983). Dabei geht es also nicht um die direktive Aktivierung spezieller fachlicher Inhalte, sondern darum, vorhandenes Wissen um Lern- und Arbeitsstrategien zur reflexiven Auseinandersetzung mit praktischen Situationen anzuregen (Konrad 2006; Wirth 2009). Somit begreifen wir Reflexion – ähnlich wie bei Clarà (2015) beschrieben –, weniger als eine Abfolge von Schritten, die formal eingehalten werden sollen, sondern stärker als tiefenorientierte Auseinandersetzung mit der pädagogischen Situation.

Um Reflexion anzuregen eignen sich Prompts, die sich auf die Nutzung von kognitiven Lernstrategien wie der Verknüpfung und Strukturierung beziehen, sowie auf metakognitive Lernstrategien der Überwachung und Regulation des Lernprozesses (z. B. Nückles et al. 2009). Studierende werden angeregt, aktuelle Situationen mit ihren eigenen Erfahrungen abzugleichen, Theorien und Befunde heranzuziehen und diese miteinander und mit der Situation in Zusammenhang zu bringen, und darüber hinaus für sich selbst und die professionelle Entwicklung Schlüsse zu ziehen (Schellenbach-Zell 2020). Die bisherige Forschung stellt Prompts als effektiv für die Integration von Wissen aus verschiedenen Wissensbereichen (also fachdidaktisches Wissen, Fachwissen und pädagogisches Wissen) heraus (Graichen et al. 2019; Lehmann et al. 2019). Sie können auch die Nutzung von Theorien und Befunden bei der schriftlichen Reflexion von pädagogischen Situationen unterstützen (Schellenbach-Zell 2022). Offen bleibt in bisheriger Forschung, ob Prompts auch Prozesse höherer reflexiver Qualität unterstützen können.

3.2 Prozessbezogenes Feedback

Feedback zeigt sich über zahlreiche Studienbefunde hinweg als effektive Methode zur Unterstützung von Lernprozessen (Wisniewski et al. 2020) – auch in der Lehrkräftebildung (zusammenfassend Prilop et al. 2021). In der Begleitung von Studierenden in Praxisphasen stellt explizites prozessbezogenes Feedback durch Dozierende als externe Informationsquelle (Narciss 2012) ein zentrales Element dar. Feedback lässt sich verstehen als „information communicated to the learner that is intended to modify his or her thinking or behavior to improve learning“ (Shute 2008, S. 153). Dabei umfassen elaborierte Feedbackformen in Abgrenzung zu einfachen Formen Informationen zu Konzepten oder auch Lösungsstrategien (Narciss 2006). Hattie und Timperley (2007) definieren verschiedene Dimensionen eines elaborierten Feedbacks: zum aktuellen Leistungsstand, zum Ziel selbst und auch dazu, wie das Ziel erreicht werden kann. Feedbackprozesse lassen sich dementsprechend verstehen als „processes in which learners make sense of information about their work in order to improve learning strategies and future performance“ (Henderson et al. 2019, S. 22). Gerade elaboriertes Feedback kann Noviz*innen mit geringer Expertise bei der Reflexion in Lerntagebüchern unterstützen (Roelle et al. 2011).

Studierende, die Expert*innenfeedback erhalten haben, fühlen sich sicherer, über ausreichendes Wissen für die Unterrichtspraxis zu verfügen (Bardach et al. 2021) und weisen eine verbesserte professionelle Wahrnehmung von Klassenführung auf (Weber et al. 2018). Expert*innenfeedback unterstützt darüber hinaus die professionelle – und damit wissenschaftsbasierte – Unterrichtswahrnehmung (Prilop et al. 2021). Rückmeldungen durch Dozierende können Studierende auch darin unterstützen, Lerntagebücher mit höherer Reflexionsqualität im Sinne einer Bearbeitung aller vorgegebenen Phasen innerhalb eines Reflexionszyklus anzufertigen (Pieper et al. 2021) und ihr wissenschaftliches Wissen in Zusammenhang mit selbstgewählten pädagogischen Situationen zu bringen (Schellenbach-Zell 2022).

4 Fragestellung und Hypothesen

Wir gehen der Frage nach, inwieweit die Verwendung von Instruktionshilfen wie Prompts bzw. einer Kombination von Prompts und leitfadengestütztem Dozierendenfeedback, die inhalts- und die prozessbezogene Reflexion einer pädagogischen Unterrichtssituation unterstützen kann. Folgende Hypothesen und – sofern sich die Formulierung eindeutiger Hypothesen nicht eindeutig aus dem Forschungsstand ableiten lässt – explorative Fragen stellen wir auf:

4.1 Hypothesen zur inhaltsbezogenen Auseinandersetzung

H1a

Studierende, die Prompts für ihre Reflexion erhalten, nehmen mehr thematische Perspektiven ein und greifen dabei eher auf wissenschaftliches Wissen zurück als Studierende ohne Prompts.

H1b

Studierende, die zusätzlich ein leitfadengestütztes Dozierendenfeedback erhalten, übertreffen dabei Studierende ohne systematisches Feedback.

4.2 Hypothesen und Frage zur prozessbezogenen Auseinandersetzung

In Anlehnung an Aeppli und Lötscher (2016) unterscheiden wir zwischen analyse- und handlungsorientierten Reflexionsprozessen:

H2a

Studierende, die Prompts für ihre Reflexion erhalten, nutzen mehr Prozesse. Dies betrifft sowohl die analyse- (H2a1) als auch die handlungsorientierten Prozesse (H2a2).

H2b

Studierende, die zusätzlich ein leitfadengestütztes Dozierendenfeedback erhalten, übertreffen Studierende ohne systematisches Feedback in der Nutzung der Prozesse. Dies gilt sowohl für die analyse- (H2b1) als auch die handlungsorientierten Prozesse (H2b2).

H3a

Studierende, die Prompts für ihre Reflexion erhalten, weisen insgesamt eine höhere Vielfalt bei der Prozessnutzung auf.

H3b

Studierende, die zusätzlich ein leitfadengestütztes Dozierendenfeedback erhalten, übertreffen dabei Studierende ohne Feedback in der Vielfalt der Prozessnutzung.

Fragestellung 1

Inwieweit unterscheiden sich Studierende der drei Untersuchungsgruppen im Hinblick auf die Qualität ihrer Reflexionsprozesse?

5 Methodisches Vorgehen

5.1 Kontext der Studie

Die Studie ist Teil des QLB-Projektes „Kohärenz in der Lehrerbildung“ (s. Förderhinweis am Ende) und wurde im Kontext des Praxissemesters in NRW durchgeführt. Das Praxissemester in NRW ist ein fünfmonatiges Pflichtpraktikum im fortgeschrittenen Studium (2. Mastersemester), das u. a. von den Bildungswissenschaften vorbereitet und begleitet wird. Die Begleitung sieht die Anfertigung von mehreren Lerntagebüchern vor, die zum Abschluss des Moduls benotet werden.

5.2 Teilnehmer*innen und Design

187 Lehramtsstudierende nahmen an der vorliegenden Studie teil. Aufgrund der Berücksichtigung von Kovariaten, die zu unterschiedlichen Zeitpunkten mit anderen Instrumenten erhoben wurden, reduzierte sich die zu analysierende Stichprobe auf insgesamt n = 156 (70,5 % weiblich, MAlter = 26,55, SDAlter = 3,02). Die Studierenden befanden sich im Durchschnitt im zweiten oder dritten Mastersemester. Die Stichprobe gliederte sich auf in 24,4 % Studierende des Lehramtes Grundschule, 14,1 % des Lehramts für Haupt‑, Real- und Gesamtschulen, 50,6 % des Lehramtes Gymnasien sowie 9,6 % für das Lehramt Berufskolleg (restliche Prozent ohne Angaben). Zu Beginn des Praxissemesters wurden die Studierenden im Kursverbund zufällig einer der drei Bedingungen zugeordnet: Kontrollgruppe (KG, n = 16, 81,3 % weiblich, Ø Alter = 27 Jahre), Prompts-Gruppe (PG, n = 84, 65,4 % weiblich, Ø Alter = 27 Jahre) oder Prompts-plus-Feedback-Gruppe (PFG, n = 56, 78,6 % weiblich, Ø Alter = 26 Jahre).

Alle Studierenden hörten im Rahmen ihrer Vorbereitungskurse einen Vortrag zu den theoretischen Grundlagen des Themas Reflexion und deren Relevanz, sowie zur Professionalisierung und Theorie-Praxis-Verknüpfung. Die Nutzung von Theorien und Befunden wurde beispielhaft verdeutlicht. Vorgesehen waren insgesamt fünf Lerntagebücher, in denen Studierende zunächst selbstgewählte praktische Situationen reflektieren sollten. Dabei erhielten die Studierenden je nach Untersuchungsbedingung ab dem zweiten Lerntagebuch Prompts zur Strukturierung, bzw. Prompts in Verbindung mit einem leitfadengestützten Feedback der Dozierenden. Im letzten Lerntagebucheintrag fertigten alle Studierenden Reflexionen zu einer vorgegebenen Vignette an, deren Bearbeitung die Datengrundlage für die nachfolgenden Auswertungen bietet (vgl. Abb. 1 zum Design).

Abb. 1
figure 1

Design der Studie

Die Vignette umfasste eine Situation im Unterricht, die vielfältige theoretische Anknüpfungspunkte bietet (vgl. online Supplement 1). Die Situation sollte erklärt werden und Konsequenzen für die eigene Professionalisierung abgeleitet werden.

Zur Erfassung der Stichprobencharakteristika und Kovariaten (siehe 5.5) wurde je ein Fragebogen vor und nach der Praxisphase eingesetzt.

5.3 Instruktionale Bedingungen

Allgemeine Instruktion ohne spezifische Prompts und Feedback (KG): Das erste Lerntagebuch für alle Studierenden und die Folgelerntagebücher 2 bis 4 für die Studierenden der KG wurde mit einer allgemeinen Formulierung instruiert, wie sie auch in der bisherigen bildungswissenschaftlichen Begleitung des Praxissemesters üblich war: „Suchen Sie sich eine für Sie relevante pädagogische Situation (im Rahmen des Schulbetriebs oder des Unterrichts) aus. Beschreiben Sie Ihre Situation und erklären Sie sie – auch vor dem Hintergrund von Theorien und Befunden. Wie bewerten Sie Ihr eigenes Handeln? Wo besteht kurz-/mittel-/langfristig Entwicklungsbedarf auf Ihrer Seite? Nennen Sie mindestens eine benutzte Quelle. Ab hier haben Sie Platz, Ihre ausgewählte pädagogische Situation auf etwa zwei bis drei Seiten zu reflektieren.“

Prompts (PG): Analog zur KG wurden die Studierenden aufgefordert, eine für sie relevante Situation zu beschreiben. Die Auseinandersetzung mit den wissenschaftlichen Wissensbeständen in Form von Theorien und Befunden wurde jedoch über Prompts angeleitet. Diese Prompts orientierten sich an bereits etablierten kognitiven und metakognitiven Lernstrategien zur Informationsgewinnung aus Texten und zur Wissensintegration (Nückles et al. 2009; Wäschle et al. 2015), die nun auf die Nutzung von Theorien und Befunden bezogen wurden. Eine Formulierung wie „Inwieweit können andere Theorien und Befunde die Erklärung der Situation weiter untermauern? Kennen Sie Theorien und Befunde, die zu Ihrer Erklärung im Widerspruch stehen?“ sollte Studierende beispielsweise dazu anregen, nach weiteren wissenschaftlichen Erklärungen zu suchen und diese zueinander zu relationieren. Im Sinne der Evaluation des eigenen Lernprozesses erhielten die Studierenden auch Prompts im Hinblick auf ihre professionelle Entwicklung. Eine hierarchische Anordnung oder eine bestimmte textliche Struktur ist dabei nicht intendiert (vgl. Prompts bei Schellenbach-Zell 2020).

Prompts plus Feedback (PFG): Studierende in der PFG erhielten über die Prompts hinaus zusätzlich zu jedem eingereichten Lerntagebucheintrag ein Feedback durch ihre Dozierenden. Der Feedback-Leitfaden berücksichtigte zum einen Dimensionen guten Feedbacks mit entsprechenden Fragen nach Hattie und Timperley (2007), aber auch die zunehmende Komplexität der Reflexionen und der entsprechenden Einordnung der Leistung (vgl. z. B. Wollenschläger et al. 2011). Die Dozierenden markierten auf einem entsprechenden Dokument, inwieweit die Studierenden beispielsweise auf wissenschaftliche Wissensbestände zurückgegriffen haben. Die eingangs formulierten Prompts wurden auf dem Dokument noch einmal aufgeführt, um Möglichkeiten der Überarbeitung aufzuzeigen. Die Dozierenden konnten darüber hinaus individualisierte Feedbacknachrichten hinterlassen (vgl. online Supplement 2).

5.4 Abhängige Variablen

Themen und Verwendung von wissenschaftlichem Wissen (inhaltsbezogene Reflexionsdimension)

Die Kodierung erfolgte zweistufig und orientiert sich am Vorgehen der evaluativen qualitativen Inhaltsanalyse (Kuckartz 2016). Im ersten Schritt wurden im gesamten Lerntagebuch Themen identifiziert, die bei der Reflexion aufgegriffen wurden. Dazu entwickelten wir vorab einen Themenkatalog auf der Grundlage des Lehrwerks „Handwörterbuch der Pädagogischen Psychologie“ von Rost et al. (2018). Inhaltlich einschlägige Themen (z. B. Motivation) wurden gelistet, skizziert und um fehlende Themen aus den Lerntagebüchern induktiv ergänzt. Im zweiten Schritt schätzten wir die Lerntagebücher daraufhin ein, ob ein Thema aufgegriffen wurde und ob dabei erkennbar auf wissenschaftliche Theorien zurückgriffen und eindeutige Begrifflichkeiten genutzt wurden (vgl. Kodiertabelle im online Supplement 3). Bei der mittelinferenten Kodierung wurden mindestens 32 % der Lerntagebücher von zwei Rater*innen kodiert (zum Umfang vgl. O’Connor und Joffe 2020). Ab einem gewichteten Kappa (Cohen 1968; Hallgren 2012) von 0,61 gingen wir von einer substantiellen Übereinstimmung aus (Landis und Koch 1977; alle Übereinstimmungskoeffizienten in der Kodiertabelle im online Supplement 3). Uneindeutige Kodiereinheiten wurden stets gemeinsam abgestimmt (Hopf und Schmidt 1993).

Prozesse und reflexive Qualität (prozessbezogene Reflexionsdimension)

Bei der Kategorisierung unterschiedlicher Prozesse orientierten wir uns an den Prozesseinteilungen von Csanadi et al. (2021) sowie von Kuhn und Moore (2015) und ergänzten diese induktiv um weitere Kategorien, die sich im Material zeigten. Da sich für die verwendeten Prozesse und deren reflexive Qualität keine einheitlichen Kodiereinheiten bestimmen ließen, die eine gemeinsame Vorsegmentierung des Materials ermöglicht hätten, orientierten wir uns beim Kodierprozess an Vorschlägen von O’Connor und Joffe (2020) und Campbell et al. (2013). Mittels einer Suchstrategie legten jeweils ein*e Kodierende*r Sinneinheiten für die Prozesse fest, d. h. wenn der Text Hinweise auf einen Prozess gab, wurde die den Hinweis umgebende Sinneinheit als zu kodierendes Segment definiert. Die Hinweise auf Kodierungen wurden anschließend entfernt, sodass die zweite Person mit den entstandenen Segmenten arbeiten konnte.

Wir unterschieden zwischen analyse- und handlungsbezogenen Prozessen: In der Analysephase werden die Prozesse (1) Beschreibung einer Theorie, (2) Nutzung eines Befunds und (3) Deutungen verwendet. Die handlungsorientierte Phase umfasst die Prozesse (4) Formulierung von Handlungsalternativen und (5) Ableitungen für die eigene Professionalisierung (vgl. Kodierschema im online Supplement 4). Nach 12,6 % des gesamten Materials erreichten wir für die mittelinferente Kodierung eine Übereinstimmung zwischen zwei Rater*innen von Cohens Kappa = 0,84. Der weitere Kodierprozess erfolgte getrennt. Die Segmentierung wurde nach dem Abgleich der Übereinstimmung zwischen drei Personen diskutiert, wobei uneindeutige Segmente gemeinsam bestimmt wurden.

Im zweiten Schritt unterschieden wir in Anlehnung an Hartmann et al. (2021) die reflexive Qualität der Prozesse innerhalb der einzelnen Prozesskategorien, d. h. wie die Statements zueinander relationiert wurden (vgl. Kodierschema im online Supplement 4): (1) Die unterste Stufe (keine Anzeichen von Reflexivität) zeichnet sich durch hohe Eindeutigkeit und die Darstellung von Gewissheiten aus, während in der (2) zweiten Stufe (Anzeichen von Reflexivität) Ansätze von Relativierungen vorgenommen und Alternativerklärungen im Ansatz erwogen werden. Die (3) dritte Stufe (reflexives Abwägen) ist geprägt von abwägenden Statements zwischen den Kodiereinheiten dieser Prozesskategorie. Nach der gemeinsamen Kodierung von zwei Rater*innen von insgesamt 12,6 % des Materials erhielten wir ein gewichtetes Kappa von 0,75. Dies kann angesichts der hohen Inferenz der Kodierung als gut betrachtet werden. Die weitere Kodierung erfolgte danach getrennt. Zweifelsfälle wurden konsensuell entschieden.

5.5 Kovariaten

Vorwissen

Es wurde der PUW-Pädagogisches Unterrichtswissen eingesetzt (König und Blömeke 2009, 2010). Der Test besteht aus offenen und geschlossenen Fragen. Die korrekt beantworteten Fragen wurden aufsummiert (theoretisches Maximum: 79 Punkte; M = 34,22, SD = 7,3).

Vorstellungen zur Relation von Theorie und Praxis

Unter Rückgriff auf Vorarbeiten von Bleck et al. (2017) sowie Herzmann et al. (2017) entwickelten wir ein Instrument mit drei Unterskalen (1 – stimme nicht zu bis 6 – stimme völlig zu), die jeweils einzeln in die Analyse eingehen: (1) Theorie und Praxis schließen sich aus (keine Verknüpfung: 7 Items, Cronbachs α = 0,83; M = 3,23, SD = 0,88; z. B. „Theorien können mir in praktischen Situationen nicht weiterhelfen.“); (2) gute Theorien sind anwendbar (Technologie: 5 Items, Cronbachs α = 0,66; M = 4,31, SD = 0,78; z. B. „Eine gute Theorie zeichnet sich durch die eindeutige Passung zu praktischen Situationen aus.“); (3) Theorien bilden eine Reflexionsgrundlage zum Verstehen von Praxis (Reflexion: 6 Items, Cronbachs α = 0,78; M = 4,56, SD = 0,70; z. B. „Theorien können dabei helfen, komplexe praktische Situationen zu verstehen.“).

5.6 Analysen

Wir berechneten insgesamt vier multivariate Kovarianzanalysen (MANCOVAs) mit unterschiedlichen abhängigen Variablen (AV)Footnote 1: (1) die aufsummierten Themen sowie die aufsummierten wissenschaftlichen Bezüge innerhalb der Themen, (2) die Häufigkeit der drei analysebezogenen Prozesse (Beschreibung von Theorien, Nutzung von Befunden, Deutung), (3) die Häufigkeit der beiden handlungsbezogenen Prozesse (Formulierung von Handlungsalternativen, Ableitung für die eigene Professionalisierung), (4) die Summe der verschiedenen Prozessnutzungen (Vielfalt der Prozessnutzung) sowie der Mittelwert über die Reflexivitätseinschätzungen je genutztem Prozess. Wies die MANCOVA signifikante Unterschiede aus, wurde in den univariaten Teststatistiken nach der Lokalisierung der Unterschiede gesucht. Gegebenenfalls wurden anschließend geplante Kontraste berechnet, in denen die verschiedenen Gruppen bonferronikorrigiert (p = 0,017) gegeneinander getestet wurden. Die verschiedenen Voraussetzungen zur Durchführung einer MANCOVA wurden überprüft (Multivariate Normalität mit multivariaten Ausreißern, Gleichheit der Varianzen, Linearitäten, Multikollinearität, Homogenität der Regressionssteigungen). Aufgrund der Verletzung der Annahme von multivariaten Normalverteilungen wurde die Pillai-Spur als Teststatistik genutzt, die als robust gegen Abweichungen der Normalverteilung gilt (Field 2018). Zusätzlich wurden vorab univariate Varianzanalysen zur Vergleichbarkeit der drei Gruppen in den Kovariaten durchgeführt. Diese ergaben keine signifikanten Unterschiede.

6 Ergebnisse

6.1 Effekte von Prompts und Feedback auf die Anzahl der Themen und die dabei hergestellten wissenschaftlichen Bezüge

Die Untersuchungsgruppen unterscheiden sich nicht hinsichtlich der Anzahl der erwähnten Themen und der dabei hergestellten wissenschaftlichen Bezüge, F (4, 298) = 1,61, p = 0,17, Pillai-Spur = 0,04 (deskriptive Werte siehe Tab. 1). Die in die Analysen eingeschlossene Kovariate Vorwissen weist einen signifikanten Zusammenhang mit der Breite der Themen auf (vgl. Tab. 2 zur Übersicht). Somit können die Hypothesen H1a und H1b nicht bestätigt werden. Prompts und Feedback haben im Vergleich zur Kontrollgruppe keine Effekte auf die Anzahl der Themen und die dabei hergestellten wissenschaftlichen Bezüge.

Tab. 1 Deskriptive Statistiken für die Variablen Anzahl der Themen und Herstellung wissenschaftlicher Bezüge (nKG = 16; nPG = 84; nPFG = 56)
Tab. 2 Tests der Zwischensubjekteffekte für Anzahl der Themen und die hergestellten wissenschaftlichen Bezüge

6.2 Effekte von Prompts und Feedback auf die analysebezogenen Prozesse

Tab. 3 beinhaltet die deskriptiven Statistiken für die verschiedenen Prozessvariablen je Gruppe. Die MANCOVA zeigt signifikante und substantielle Effekte der Gruppenzugehörigkeit, F (6, 296) = 2,52, p = 0,02, Pillai-Spur = 0,10, part. η2 = 0,05. Die Kontrolle der univariaten Tests ergibt, dass die mittleren bis großen Effekte auf Unterschiede in den Prozessen Beschreibung von Theorien und Deutung zurückgehen (vgl. Tab. 4).

Tab. 3 Deskriptive Statistiken für die analysebezogenen Prozesse (nKG = 16; nPG = 84; nPFG = 56)
Tab. 4 Tests der Zwischensubjekteffekte für die analysebezogenen Prozesse

In geplanten Kontrasten wird im Zusammenhang mit dem Prozess Beschreibung von Theorien die PFG gegen die KG getestet (t (149) = −3,16, p = 0,00, part. η2 = 0,06) und ist dieser signifikant überlegen, nicht jedoch der PG. Wird die KG gegen die PG getestet, so weist letztere tendenziell höhere Werte auf, allerdings mit geringer Effektstärke (t (149) = 2,25, p = 0,03, part. η2 = 0,03).

Für den Prozess Deutung zeigt sich ebenso: Die Testung der PFG gegen die KG weist für die PFG signifikant höhere Werte aus (t (149) = −3,04, p = 0,00, part. η2 = 0,06), nicht aber in einem Test gegen die PG. Der Test der KG gegen die PG ergibt für die PG ein signifikantes Ergebnis, die PG weist auch hier höhere Werte auf (t (149) = 2,58, p = 0,01, part. η2 = 0,04).

Die aufgestellten Hypothesen zu den Effekten von Prompts (H2a1) bzw. der Kombination von Prompts und Feedback (H2b1) auf die analysebezogenen Prozesse lassen sich teilweise bestätigen: Studierende mit Prompts (also PG und PFG) nutzen den Prozess Theoriebeschreibung mehr und verwenden mehr Deutungen als Studierende ohne Prompts.

6.3 Effekte von Prompts und Feedback auf handlungsbezogene Prozesse

Es liegen signifikante Gruppeneffekte vor, F (4,298) = 3,90, p = 0,00, Pillai-Spur = 0,10, part. η2 = 0,05 (deskriptive Werte vgl. Tab. 5). Univariate Tests zeigen, dass diese Effekte auf Unterschieden in den Ableitungen für die eigene Professionalisierung basieren (vgl. Tab. 6). Eine relevante Kovariate stellt das Vorwissen für die Formulierung von Handlungsalternativen dar.

Tab. 5 Deskriptive Statistiken für die handlungsbezogenen Prozesse (nKG = 16; nPG = 84; nPFG = 56)
Tab. 6 Tests der Zwischensubjekteffekte für die handlungsbezogenen Prozesse

Geplante Kontraste im Bereich der Überlegungen zur eigenen Professionalisierung testen zunächst PFG gegen KG (t (149) = −2,84, p = 0,01, part. η2 = 0,05) und die PG (t (149) = −3,62, p = 0,00, part. η2 = 0,08), dabei ist die PFG beiden Gruppen signifikant überlegen. KG und PG unterscheiden sich nicht signifikant voneinander.

Die Hypothesen H2a2 und H2b2 zu den Effekten von Prompts respektive Prompts und Feedback auf die handlungsbezogenen Prozesse werden somit teilweise bestätigt: Studierende der PFG übertreffen beide andere Gruppen im Hinblick auf die Ableitungen für ihre eigene Professionalisierung.

6.4 Effekte von Prompts und Feedback auf die Vielfalt der genutzten Prozesse und die reflexive Qualität der verwendeten Prozesse

Hier lassen sich signifikante Gruppeneffekte identifizieren, F (4,298) = 4,04, p = 0,00, Pillai-Spur = 0,10, part. η2 = 0,05 (vgl. Tab. 7 zu den deskriptiven Werten). Univariate Statistiken verweisen zum einen auf Gruppenunterschiede in der Vielfalt der genutzten Prozesse, zum anderen auf bedeutsame Zusammenhänge mit zwei Kovariaten (vgl. Tab. 8). Hinsichtlich der reflexiven Qualität in den Prozessen bestehen keine Gruppenunterschiede.

Tab. 7 Deskriptive Statistiken für Vielfalt der genutzten Prozesse und die reflexive Qualität der verwendeten Prozesse (nKG = 16; nPG = 84; nPFG = 56)
Tab. 8 Tests der Zwischensubjekteffekte für die Vielfalt der genutzten Prozesse und der reflexiven Qualität der verwendeten Prozesse

Geplante Kontraste im Bereich der Vielfalt der genutzten Prozesse testen zunächst die PFG gegen die KG (t (149) = −3,31, p = 0,00, part. η2 = 0,07) und die PG (t (149) = −2,76, p = 0,00, part. η2 = 0,05). Personen der PFG nutzen mehr unterschiedliche Prozesse als PG und KG. KG und PG unterscheiden sich im Hinblick auf die Vielfalt der genutzten Reflexionsprozesse nicht voneinander.

Somit lassen sich die Hypothesen zu den Effekten von Prompts (H3a) respektive einer Kombination aus Prompts und Feedback (H3b) nur teilweise aufrechterhalten: Studierende mit zusätzlichem Feedback übertreffen beide anderen Studierendengruppen im Hinblick auf die Vielfalt bei der Nutzung der Prozesse. Wir finden keine Hinweise darauf, dass sich die Treatments auf die reflexive Qualität der verwendeten Prozesse auswirken.

7 Diskussion

In diesem Beitrag untersuchten wir Effekte von Prompts und leitfadengestütztem Dozierendenfeedback auf die reflexiv-wissensbezogene Auseinandersetzung von Studierenden mit einer Situationsvignette, die in Form eines Lerntagebuchs reflektiert wurde. Dazu verglichen wir zum einen Studierende, die im Laufe der Praxisphase Prompts für ihre Reflexionen erhielten (PG), sowie Studierende, die zusätzlich zu den Prompts noch ein leitfadengestütztes Dozierendenfeedback bekamen (PFG), mit Studierenden, die eine einfache Anweisung für die Erstellung ihres Lerntagebuchs erhielten (KG). Es zeigt sich, dass alle Studierende vielfältige Themen einbringen, in denen wissenschaftliche Wissensbestände erkennbar sind. Eine inhaltsbezogene Reflexion findet somit unabhängig von der Unterstützung durch Prompts und Feedback bei allen Studierenden statt. Damit befinden sich die Ergebnisse im Einklang mit Befunden bei Csanadi et al. (2021) sowie Schellenbach-Zell (2022). Betrachtet man jedoch die Analyseebene von Prozessen der Auseinandersetzung, dann liegt die Folgerung nahe, dass diese Rückgriffe ohne weitere Unterstützung oft kursorisch bleiben. Im Hinblick auf die Prozesse der Auseinandersetzung zeigte sich, dass alle Studierenden, die Prompts erhalten, Theorien ausführlicher beschreiben und mehr Deutungen der Situation vornehmen als Studierende der KG (bei der Beschreibung der Theorien sind die Studierenden der PG der KG jedoch nur tendenziell überlegen). Studierende mit der in dieser Studie realisierten Begleitung durch Prompts und Feedback leiten deutlich mehr Konsequenzen für die eigene Professionalität ab als Studierende aus PG oder KG. Die PFG übertrifft sowohl die KG als auch die PG bei der Vielfalt der verschiedenen Prozesse. Der Einsatz von Prompts und Feedback führt jedoch nicht zu einer höheren reflexiven Qualität der Prozesse.

Insgesamt lässt sich konstatieren, dass die untersuchten Prompts verschiedene reflexive Prozesse der Auseinandersetzung mit wissenschaftlichen Wissensbeständen anregen können. Insbesondere im Hinblick auf die handlungsbezogenen Prozesse kommt darüber hinaus dem Feedback der Dozierenden eine maßgebliche Rolle zu. Das Feedback scheint sich darauf auszuwirken, dass Studierende Bezüge zu sich selbst und ihrer zukünftigen Professionalität herstellen. Werden solche Bezüge jedoch wenig oder gar nicht hergestellt, so besteht die Gefahr, dass der Sinn und Zweck einer solchen reflexiv ausgerichteten Lerngelegenheit im Rahmen des Praxissemesters für die Entwicklung einer professionellen Identität unerkannt bleibt und Studierende nur reflektieren, weil es von ihnen verlangt wird (Häcker 2017).

Die Studie zeigt weiterhin, dass Prompts und Feedback zwar dabei unterstützen können, unterschiedliche reflexive Prozesse anzuregen, dass es jedoch eine Herausforderung für Studierende bleibt, qualitativ hochwertige Reflexionen pädagogischer Situationen zu vollziehen, die der ihr inhärenten Komplexität und prinzipiellen Unsicherheit gerecht werden. Ein (meta-)reflexives Abwägen zwischen verschiedenen (wissenschaftlichen) Erklärungsansätzen im Zusammenspiel mit der konkreten Unterrichtssituation, wie es auch von Cramer et al. (2019) idealtypisch beschrieben wird, bleibt selbst nach umfassender Anleitung durch gezielte Prompts und spezifisches Feedback weitgehend unerreicht. Es ist davon auszugehen, dass dafür ein intensiveres Training, z. B. hinsichtlich Argumentationskompetenzen (Trempler und Hartmann 2020) und Komponenten kritischen Denkens (Fischer et al. 2014) mit Augenmerk auf die Besonderheiten von pädagogischen Situationen notwendig wäre, welches in die Begleitung von Praxisphasen integriert werden müsste. Allerdings steht vor der Implementierung solcher Formate zunächst die Aufgabe, durch empirische Forschung nachzuweisen, dass sich ein derartig ausgelegter reflexiver Umgang mit pädagogischen Situationen auch auf die Ebene professioneller Handlungen (z. B. hinsichtlich der Ausweitung wahrgenommener Handlungsspielräume) positiv auswirken kann, wie dies in Professionalisierungsmodellen postuliert wird (z. B. Cramer et al. 2019). Die bisherigen Erkenntnisse zum Zusammenhang von wissensbezogener Auseinandersetzung und reflexiver Praxis (z. B. Hartmann et al. 2021; Kiemer und Kollar 2021) dringen nicht bis in tatsächliche, komplexe Handlungssituationen von Lehrkräften vor – dies wäre ein notwendiger Schritt, um der oftmals wiederholten Forderung nach Reflexion in der Lehrkräftebildung auch empirisch gestützt Nachdruck zu verleihen.

7.1 Limitationen

Einschränkend ist anzumerken, dass die Studierenden nur als Cluster in Form ihrer Seminargruppen einer der drei Untersuchungsgruppen randomisiert zugeteilt wurden. Obwohl die endgültige Studienteilnahme nach der Kurszuweisung freiwillig erfolgte, sind die Untersuchungsgruppen zudem unterschiedlich groß, die Kontrollgruppe ist zahlenmäßig deutlich geringer besetzt als die beiden Experimentalgruppen. Systematische Gründe auf Kurs- oder Individualebene für die Entscheidung der Studierenden für oder gegen eine Teilnahme sind uns nicht bekannt, können jedoch nicht ausgeschlossen werden. Auch das Ausmaß und der Inhalt eines möglichen Feedbacks der Dozierenden an die Untersuchungsteilnehmende, die nicht Teil der PFG waren, wurde nicht systematisch kontrolliert. Vorstellbar ist zudem, dass Dozierende der PFG ihren Studierenden über das Feedback noch mehr Informationen zu denkbaren weiteren Handlungsalternativen geben konnten, die Effekte also auf einen Informationsvorsprung der PFG zurückgehen könnten. Intensive Treatment Checks und auch Vergleiche in der Darbietung von Prompts wären in Folgestudien angeraten. Eine weitere Einschränkung stellt die kleine Auswahl der in den Analysen berücksichtigen Kovariaten dar. Dies betrifft bei den Überzeugungen die alleinige Fokussierung auf den Umgang mit Theorien. Dies sollte in Anschlussstudien auch auf den Umgang mit empirischen Studienbefunden ausgeweitet werden, um hier analog Einstellungen zur Nützlichkeit von Evidenz und Reflexion erfassen zu können. Möglich ist, dass weitere Variablen wie die Motivation, Lerntagebücher anzufertigen, oder die zeitlichen Ressourcen, die für die Erstellung der Lerntagebücher eingesetzt wurden, das Ausmaß an Reflexion ebenso beeinflussen können wie auch die Relevanz der präsentierten Situation bzw. deren Reflexion über deren Notwendigkeit für das Bestehen der Modulabschlussprüfung hinaus. Denkbar ist auch, dass Studierende die Möglichkeiten zur Auseinandersetzung auf der Basis der verschiedenen Reflexionshilfen im Sinne eines overpromptings (Nückles et al. 2006) nicht (mehr) erschöpfend genutzt haben.

7.2 Schlussfolgerungen

Im Hinblick auf die Ausgestaltung von Lehrer*innenbildung erweist sich der Einsatz von Prompts und Feedback zur Unterstützung einer Reflexion von pädagogischen Situationen mit dem Fokus auf den Einbezug wissenschaftlicher Wissensbestände als prinzipiell geeignet. Es sollten jedoch auch die Grenzen dieser instruktionalen Unterstützungen bedacht werden. Die heterogenen Befunden dieser Studie legen nahe, dass eine Unterscheidung von Reflexion in eine Inhalts- und eine Prozessebene sowie weitere Ausdifferenzierungen der verwendeten Prozesse sinnvoll und hilfreich ist. So konnte aufgezeigt werden, dass Studierende gezielt darin unterstützt werden können, Prozesse anzuwenden, die sowohl ihr Verständnis pädagogischer Situationen sowie eine Professionalisierung als zukünftige Lehrkraft fördern und sie auf Handlungsentscheidungen unter Unsicherheit vorbereiten. Eine Herausforderung, auf die die vorliegende Studie hinweist, besteht darin, angehende Lehrkräfte gezielt für einen abwägenden Modus von Reflexion zu schulen, in dem wissenschaftliche Theorien und Befunde hinsichtlich ihres Erklärungsgehaltes für konkrete pädagogische Situationen gegeneinander abgewogen werden und unter der inhärenten Unsicherheit des pädagogischen Handelns bestmögliche Lösungen gefunden werden. Allerdings sind solche Prozesse nicht isoliert von weiteren Facetten von Reflexion zu betrachten, die in der Literatur zusammengefasst werden (z. B. Beauchamp 2006). Erste qualitative Studien zeigen Wege dafür auf, wie dieser inhärenten Komplexität pädagogischer Situationen in innovativen Formaten der Lehrer*innenaus- und -fortbildung Rechnung getragen werden kann (Caspari-Gnann und Sevian 2022; Schneider Kavanagh et al. 2020). Die vorliegende Studie leistet für den Bereich der wissensbezogenen Auseinandersetzung einen Beitrag, der angesichts erster internationaler Befunde (Barnes et al. 2020) als relevant für professionelles Handeln von erfahrenen Lehrkräften angesehen werden kann. Weitere Forschung zu gezielten Unterstützungsmöglichkeiten für Lehrkräfte am Beginn ihrer beruflichen Laufbahn kann unserer Ansicht nach dazu beitragen, den Wert einer wissenschaftlich ausgerichteten reflexiven Lehrkräftebildung zu verdeutlichen und durchaus auch kritisch zu reflektieren.