<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma001859</Identifier>
    <IdentifierDoi>10.3205/zma001859</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0018594</IdentifierUrn>
    <ArticleType language="en">research article</ArticleType>
    <ArticleType language="de">Forschungsarbeit</ArticleType>
    <TitleGroup>
      <Title language="en">Visualizing cognitive processes in medical education: Forward and backward reasoning in a digital family medicine assessment</Title>
      <TitleTranslated language="de">Visualisierung kognitiver Prozesse in der medizinischen Ausbildung: Vorw&#228;rts- und R&#252;ckw&#228;rtsdenken in einer digitalen Pr&#252;fung der Allgemeinmedizin</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Klutmann</Lastname>
          <LastnameHeading>Klutmann</LastnameHeading>
          <Firstname>Johanna</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Dietzsch</Lastname>
          <LastnameHeading>Dietzsch</LastnameHeading>
          <Firstname>Constanze</Firstname>
          <Initials>C</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Schlasius-Ratter</Lastname>
          <LastnameHeading>Schlasius-Ratter</LastnameHeading>
          <Firstname>Ute</Firstname>
          <Initials>U</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>German Institute for State Examinations in Medicine, Pharmacy, Dentistry and Psychotherapy (IMPP), Mainz, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Institut f&#252;r medizinische und pharmazeutische Pr&#252;fungsfragen (IMPP), Mainz, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Oksche</Lastname>
          <LastnameHeading>Oksche</LastnameHeading>
          <Firstname>Alexander</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>German Institute for State Examinations in Medicine, Pharmacy, Dentistry and Psychotherapy (IMPP), Mainz, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Institut f&#252;r medizinische und pharmazeutische Pr&#252;fungsfragen (IMPP), Mainz, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Volz-Willems</Lastname>
          <LastnameHeading>Volz-Willems</LastnameHeading>
          <Firstname>Sara</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Jordan</Lastname>
          <LastnameHeading>Jordan</LastnameHeading>
          <Firstname>Sandra</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>J&#228;ger</Lastname>
          <LastnameHeading>J&#228;ger</LastnameHeading>
          <Firstname>Johannes</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Dupont</Lastname>
          <LastnameHeading>Dupont</LastnameHeading>
          <Firstname>Fabian</Firstname>
          <Initials>F</Initials>
          <AcademicTitle>Prof. Dr. med.</AcademicTitle>
          <AcademicTitleSuffix>MHPE</AcademicTitleSuffix>
        </PersonNames>
        <Address language="en">Saarland University, Department of Family Medicine, Geb. 80.2, D-66424 Homburg (Saar), Germany<Affiliation>Saarland University, Department of Family Medicine, Homburg (Saar), Germany</Affiliation></Address>
        <Address language="de">Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Geb. 80.2, 66424 Homburg (Saar), Deutschland<Affiliation>Universit&#228;t des Saarlandes, Zentrum Allgemeinmedizin, Homburg (Saar), Deutschland</Affiliation></Address>
        <Email>Fabian.dupont&#64;uks.eu</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">clinical reasoning</Keyword>
      <Keyword language="en">family medicine</Keyword>
      <Keyword language="en">forward reasoning</Keyword>
      <Keyword language="en">backward reasoning</Keyword>
      <Keyword language="en">undergraduate medical education</Keyword>
      <Keyword language="de">klinisches Denken</Keyword>
      <Keyword language="de">Allgemeinmedizin</Keyword>
      <Keyword language="de">Vorw&#228;rtsdenken</Keyword>
      <Keyword language="de">R&#252;ckw&#228;rtsdenken</Keyword>
      <Keyword language="de">medizinische Ausbildung im Grundstudium</Keyword>
      <SectionHeading language="en">clinical reasoning</SectionHeading>
      <SectionHeading language="de">Clinical Reasoning</SectionHeading>
    </SubjectGroup>
    <DateReceived>20250715</DateReceived>
    <DateRevised>20251121</DateRevised>
    <DateAccepted>20260108</DateAccepted>
    <DatePublishedList>
      <DatePublished>20260615</DatePublished>
    </DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>2366-5017</ISSN>
        <Volume>43</Volume>
        <Issue>5</Issue>
        <JournalTitle>GMS Journal for Medical Education</JournalTitle>
        <JournalTitleAbbr>GMS J Med Educ</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>65</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Hintergrund: </Mark1>W&#228;re es bei der Bewertung von Medizinstudierenden nicht hilfreich, das klinische Denken (CR) Ihrer Studierenden zu visualisieren und zu verstehen&#63; Es gibt verschiedene Arten von CR, die Studierende in ihren Multiple-Choice-Fragen (MCQs) verwenden k&#246;nnen. W&#228;hrend beim Vorw&#228;rtsdenken Daten zur Erstellung einer Hypothese verwendet werden, werden beim R&#252;ckw&#228;rtsdenken m&#246;gliche Hinweise (Antworten) zur Erstellung einer Hypothese herangezogen. Diese Studie implementiert einen neuen Ansatz zur Visualisierung von CR w&#228;hrend der digitalen MCQ-Pr&#252;fung. Dar&#252;ber hinaus untersucht sie die Auswirkungen von Feedback w&#228;hrend des Lernprozesses, auch bekannt als formatives Feedback, auf den Denkprozess.</Pgraph><Pgraph><Mark1>Methoden:</Mark1> Quantitative und qualitative Daten von zwei Semesterabschlusspr&#252;fungen im Fach Allgemeinmedizin wurden am Ende des 5. Studienjahres im Jahr 2023 gesammelt. Beide Pr&#252;fungen bestanden aus 60 MCQs und einem zus&#228;tzlichen Forschungsteil, welcher ebenfalls MCQs umfasste. W&#228;hrend des Forschungsteils erfassten die Studierenden ihren Denkprozess bei der Beantwortung der MCQs digital. Die qualitativen Daten wurden in drei Kodierungsrunden, darunter zwei Markierungs-&#47;Kodierungspartys, kodiert. </Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Diese Studie konnte CR in einer gro&#223;en Kohorte (n&#61;210) digital visualisieren. Im Durchschnitt wurden die Pr&#252;fungsfragen mit 87&#37; CR beantwortet. Vorw&#228;rtsdenken wurde signifikant h&#228;ufiger verwendet als R&#252;ckw&#228;rtsdenken (WS 22&#47;23 p&#61;0,006, SS 23 p&#60;0,001). Leistungsstarke Studierende verwendeten signifikant h&#228;ufiger Vorw&#228;rtsdenken und R&#252;ckw&#228;rtsdenken als leistungsschwache Studierende (p&#60;0,01). Formatives Feedback hatte keinen signifikanten Einfluss auf die Wahl der CR-Art (p&#61;0,281). Folgefragen k&#246;nnten eine Ver&#228;nderung des CR-Verhaltens bewirken; jedoch sind weitere Untersuchungen erforderlich (p&#60;0,001).</Pgraph><Pgraph><Mark1>Schlussfolgerung: </Mark1>Diese Studie veranschaulicht eine alternative Methode zur Visualisierung der kognitiven Prozesse von Studierenden in gro&#223;em Ma&#223;stab. Dieser Ansatz beleuchtet die erforderlichen kognitiven Prozesse. Er kann P&#228;dagogen dabei helfen, besser zu verstehen, worauf sie sich bei curricularen Lernaktivit&#228;ten zur Vorbereitung auf staatliche Pr&#252;fungen konzentrieren sollten. Diese Methode kann als Qualit&#228;tskriterium f&#252;r MCQ-Fragen von Vorteil sein, da sie sich nicht nur auf Expertenmeinungen oder Fragenmetriken st&#252;tzt, sondern auch die kognitiven Prozesse der Studierenden bei der Beantwortung von MCQs veranschaulicht.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Background: </Mark1>When evaluating medical students, wouldn&#8217;t it be helpful to visualize and understand your students&#8217; clinical reasoning (CR)&#63; There are different types of CR for students to use in their multiple-choice questions (MCQs). While forward reasoning uses data to generate a hypothesis, backward reasoning looks at possible prompts (answers) to generate a hypothesis. This study implements a new approach to visualizing CR during digital MCQ assessment. Furthermore, it examines the effect of feedback given during the learning process, also known as formative feedback, on the thought process.</Pgraph><Pgraph><Mark1>Methods: </Mark1>Quantitative and qualitative data were collected at the end of two consecutive year 5 end-of-semester Family Medicine exams in 2023. Both exams consisted of 60 MCQs and an additional research component also comprising MCQs. During the research component students digitally recorded their reasoning process while answering MCQs. Qualitative data were coded via three rounds of coding, including two marking&#47;coding parties. </Pgraph><Pgraph><Mark1>Results: </Mark1>This study was able to digitally visualize CR in a large cohort (n&#61;210). On average, the exam questions were answered with 87&#37; of CR. Forward reasoning was used significantly more often than backward reasoning (WS 22&#47;23 p&#61;0.006, SS 23 p&#60;0.001). High performers were significantly more likely to use forward reasoning and backward reasoning than low performers (p&#60;0.01). Formative Feedback had no significant influence on the choice of CR type (p&#61;0.281). Follow-up questions might stimulate a change in CR behaviour; however further research is needed (p&#60;0.001).</Pgraph><Pgraph><Mark1>Conclusion: </Mark1>This study illustrates an alternative method to visualize students&#8217; cognitive processes on a large scale. This approach sheds light on the required cognitive processes. It may help educators to better understand what to focus on during curricular learning activities aimed at preparing for state exams. This method may be beneficial as a quality criterion for MCQ questions, as it does not only rely on expert opinion or question metrics but illustrates students&#8217; cognitive processes when answering MCQ.</Pgraph></Abstract>
    <TextBlock name="Introduction" linked="yes" language="en">
      <MainHeadline>Introduction</MainHeadline><Pgraph>Clinical reasoning (CR) is a core competency in medical education representing the thought process behind diagnosing and treating patients <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>, <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>. However, visualizing or assessing CR, especially in undergraduate medical education, remains a challenge <TextLink reference="6"></TextLink>.</Pgraph><Pgraph>Although CR is central to medical practice and education, traditional assessment methods - especially MCQs, which dominate high-stakes exams, are criticized for not properly capturing the cognitive processes involved in CR <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>. Despite innovations like Key-feature Questions (KFQs), little is known about how CR can actually be mapped or visualized within standard MCQ assessments <TextLink reference="9"></TextLink>.</Pgraph><Pgraph>At the same time, many national licensing exams wish to maintain MCQs for their objectivity, standardization, and cost efficiency <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Given the widespread use and high stakes MCQ assessment it&#8217;s crucial to understand and visualize how these questions stimulate or reflect CR during those assessment periods <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. Mapping CR during these assessments may significantly enhance both educational quality and clinical preparedness for students transitioning into the clinical field.</Pgraph><Pgraph>Previous research has distinguished between forward reasoning (FR) and backward reasoning (BR) <TextLink reference="14"></TextLink> with FR being often described as the hallmark of expertise and deeper understanding <TextLink reference="15"></TextLink>. FR describes the thought process in which students answer questions without having to read through the choices, generating their hypothesis from the MCQ question stem and possible added material <TextLink reference="3"></TextLink>. BR describes thinking backwards and drawing on the answer choices (distractors) to answer the question instead <TextLink reference="3"></TextLink>. The distinction between FR and BR only captures one aspect of how CR can be described. It focuses on how the reasoning process was formed. However, CR is a multidimensional construct. It can also be understood in terms of its goals, performance and contextual factors, all of which can be the focus of analysis <TextLink reference="2"></TextLink>, <TextLink reference="4"></TextLink>. </Pgraph><Pgraph>Approaches such as KFQs and Formative Feedback (FF) have been introduced to promote CR during assessments &#91;9&#93;. KFQs focus on one difficult aspect of solving a problem, often embedding this feature in a written case followed by a limited number of questions <TextLink reference="16"></TextLink>. FF is a core element of &#8220;assessment for learning&#8221; <TextLink reference="17"></TextLink>. It provides feedback during the learning process with a focus on assisting learning <TextLink reference="17"></TextLink>. FF deepens students&#8217; understanding, even during assessments <TextLink reference="18"></TextLink>.</Pgraph><Pgraph>To date, educators use MCQ metrics to describe MCQ items and their quality.  These metrics offer valuable insights into how items perform on a population level &#8211; identifying which questions are too easy, too hard, or particularly effective at distinguishing between high- and low-performing students <TextLink reference="19"></TextLink>. However, these measures are independent of students&#8217; cognitive thought processes <TextLink reference="20"></TextLink>. They provide no information about how or why a student arrived at a particular answer. Exploring observable reasoning processes rather than MCQ metrics could provide new insights into how CR is elicited, assessed, and supported during MCQ-based exams.</Pgraph><Pgraph>Other studies have called for a better understanding of CR utilization during assessment <TextLink reference="21"></TextLink>, <TextLink reference="22"></TextLink>. This study investigates whether CR can be visualized during an undergraduate MCQ exam and how it relates to performance. Additionally, the influence of FF and follow up key feature questions (KFQ) on the usage of CR are analysed.</Pgraph><Pgraph>The aim of this study is to examine whether CR processes can be identified in the context of an undergraduate MCQ examination and to explore their relationship to student performance. More specifically, we analyse whether the use of CR, in particular FR and BR, is associated with higher performance across different item types and if and to what extent FF and follow-up key feature questions (KFQ) elicit different reasoning strategies.</Pgraph></TextBlock>
    <TextBlock name="Einleitung" linked="yes" language="de">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Klinisches Denken (Clinical Reasoning, CR) ist eine Kernkompetenz in der medizinischen Ausbildung, die den Denkprozess hinter der Diagnosefindung und Behandlung von Patienten und Patientinnen darstellt <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>, <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>. Die Visualisierung und Bewertung von CR, insbesondere in der medizinischen Grundausbildung, bleibt jedoch eine Herausforderung <TextLink reference="6"></TextLink>.</Pgraph><Pgraph>Obwohl CR f&#252;r die medizinische Praxis und Ausbildung von zentraler Bedeutung ist, werden traditionelle Bewertungsmethoden &#8211; insbesondere MCQs, die bei wichtigen Pr&#252;fungen dominieren &#8211; daf&#252;r kritisiert, dass sie die kognitiven Prozesse, die bei CR eine Rolle spielen, nicht angemessen erfassen <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>. Trotz Innovationen wie Key-Feature-Fragen (KFQs) ist wenig dar&#252;ber bekannt, wie CR tats&#228;chlich innerhalb von Standard-MCQ-Bewertungen abgebildet oder visualisiert werden kann <TextLink reference="9"></TextLink>.</Pgraph><Pgraph>Gleichzeitig m&#246;chten viele nationale Zulassungspr&#252;fungen MCQs aufgrund ihrer Objektivit&#228;t, Standardisierung und Kosteneffizienz beibehalten <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Angesichts der weit verbreiteten Verwendung und der hohen Bedeutung von MCQ-Pr&#252;fungen ist es von entscheidender Bedeutung, zu verstehen und zu visualisieren, wie diese Fragen das CR w&#228;hrend dieser Bewertungsphasen stimulieren oder widerspiegeln <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. Die Abbildung von CR w&#228;hrend Pr&#252;fungen kann die Qualit&#228;t der Ausbildung als auch die klinische Vorbereitung von Studierenden f&#252;r den klinischen Bereich erheblich verbessern.</Pgraph><Pgraph>Fr&#252;here Forschungen haben zwischen Vorw&#228;rtsdenken (Forward Reasoning, FR) und R&#252;ckw&#228;rtsdenken (Backward Reasoning, BR) unterschieden <TextLink reference="14"></TextLink>, wobei FR oft als Kennzeichen f&#252;r Fachwissen und tieferes Verst&#228;ndnis beschrieben wird <TextLink reference="15"></TextLink>. FR beschreibt den Denkprozess, bei dem Studierende Fragen beantworten, ohne die Antwortm&#246;glichkeiten durchlesen zu m&#252;ssen, und ihre Hypothese aus der MCQ-Frage und m&#246;glichen zus&#228;tzlichen Informationen ableiten <TextLink reference="3"></TextLink>. BR beschreibt das R&#252;ckw&#228;rtsdenken und das Zur&#252;ckgreifen auf die Antwortm&#246;glichkeiten (Distraktoren), um die Frage zu beantworten &#91;3&#93;. Die Unterscheidung zwischen FR und BR erfasst nur einen Aspekt der Beschreibung von CR. Sie konzentriert sich darauf, wie der Denkprozess entstanden ist. CR ist jedoch ein mehrdimensionales Konstrukt. Es kann auch im Hinblick auf seine Ziele, seine Leistung und kontextuellen Faktoren verstanden werden, die alle im Mittelpunkt der Analyse stehen k&#246;nnen <TextLink reference="2"></TextLink>, <TextLink reference="4"></TextLink>. </Pgraph><Pgraph>Ans&#228;tze wie KFQs und Formatives Feedback (FF) wurden eingef&#252;hrt, um CR w&#228;hrend der Bewertung zu f&#246;rdern <TextLink reference="9"></TextLink>. KFQs konzentrieren sich auf einen schwierigen Aspekt der Probleml&#246;sung und betten dieses Merkmal h&#228;ufig in einen schriftlichen Fall ein, gefolgt von einer begrenzten Anzahl von Fragen <TextLink reference="16"></TextLink>. FF ist ein Kernelement der &#8222;Bewertung f&#252;r das Lernen&#8221; (&#8222;assessment for learning&#8220;) <TextLink reference="17"></TextLink>. Es liefert Feedback w&#228;hrend des Lernprozesses mit dem Schwerpunkt auf der Unterst&#252;tzung des Lernens <TextLink reference="17"></TextLink>. FF vertieft das Verst&#228;ndnis der Studierenden, sogar w&#228;hrend der Pr&#252;fungen <TextLink reference="18"></TextLink>.</Pgraph><Pgraph>Bislang verwenden P&#228;dagogen und P&#228;dagoginnen MCQ-Metriken, um MCQ-Items und deren Qualit&#228;t zu beschreiben. Diese Metriken bieten wertvolle Einblicke in die Leistung von Items auf Populationsebene &#8211; sie identifizieren, welche Fragen zu einfach, zu schwer oder besonders effektiv sind, um zwischen leistungsstarken und leistungsschwachen Studierenden zu unterscheiden <TextLink reference="19"></TextLink>. Diese Messungen sind jedoch unabh&#228;ngig von den kognitiven Denkprozessen der Studierenden <TextLink reference="20"></TextLink>. Sie liefern keine Informationen dar&#252;ber, wie oder warum Studierende zu einer bestimmten Antwort gelangt sind. Die Untersuchung beobachtbarer Denkprozesse k&#246;nnte neue Erkenntnisse dar&#252;ber liefern, wie CR w&#228;hrend MCQ-basierter Pr&#252;fungen hervorgerufen, bewertet und unterst&#252;tzt wird.</Pgraph><Pgraph>Andere Studien fordern ein besseres Verst&#228;ndnis der Nutzung von CR w&#228;hrend der Pr&#252;fung <TextLink reference="21"></TextLink>, <TextLink reference="22"></TextLink>. </Pgraph><Pgraph>Das Ziel dieser Studie ist es, zu untersuchen, ob CR-Prozesse im Kontext einer MCQ-Pr&#252;fung f&#252;r Studierende identifiziert werden k&#246;nnen, und den Zusammenhang dieser mit der Leistung der Studierenden zu erforschen. Genauer gesagt analysieren wir, ob die Verwendung von CR, insbesondere FR und BR, mit einer h&#246;heren Leistung bei verschiedenen Aufgabentypen verbunden ist und ob und inwieweit FF und Folgefragen der KFQs unterschiedliche Denkstrategien hervorrufen.</Pgraph></TextBlock>
    <TextBlock name="Methods" linked="yes" language="en">
      <MainHeadline>Methods</MainHeadline><SubHeadline>Setting and study participants</SubHeadline><Pgraph>In this mixed methods study, all participants were year five undergraduate medical students at Saarland University (UdS). The exam was the end of year compulsory Family Medicine exam, a digital state exam based MCQ assessment. It contained two identical exam setups including 60 MCQs, at the end of the winter semester 2022&#47;2023 (WS 22&#47;23) and at the end of the summer semester 2023 (SS 23). Both exams contained a research component, which consisted of two KFQs. These KFQs were case studies with follow-up questions. The KFQs used were not the same. Firstly, to include a wider range of questions in the study. Secondly, to prevent students from already knowing the questions due to possible student-internal discussions about the questions. In this study, the questions will be referred to by an abbreviation. The first number indicates the case study number and the second indicates the follow-up question number. After each follow-up question of the KFQ, there was an open-ended text box question, asking for a self-assessment of whether the students derived the question clinically and their cognitive thought process used in the previous question. The same structure applied to the SS23 exam. Additionally, in SS23, students received FF for the first time during an exam for a selection of questions. The FF was uniform information-based feedback consisting of the correct answer and a brief explanation. The participants were randomly divided into two groups: A (n&#61;63) and B (n&#61;52). Group A received FF after each follow-up question of the second KFQ and Group B received FF after each follow-up question of the first KFQ. In both groups, FF was provided in reverse order, to maintain face validity and comparability of CR (with and without FF). Ethical clearance was provided before the study (234&#47;20-14.04.2022). The participants consented to the use of their study and exam performance before the exam.</Pgraph><SubHeadline>MCQ item selection </SubHeadline><Pgraph>In cooperation with the Institute for State Examinations in Medicine, Pharmacy, Dentistry and Psychotherapy (IMPP), a panel of two research students (JK, CD) and four Family Medicine faculty (SJ, SVW, FD, JJ) selected the follow-up KFQs from an MCQ pool provided by the IMPP based on the learning objectives of the semester. The follow-up KFQs used were divided into procedural, diagnostic, and factual questions.</Pgraph><SubHeadline>Data collection and analysis</SubHeadline><Pgraph>Both quantitative and qualitative data were collected and then exported to Excel (version 16.96.1). Qualitative data from both exams were analysed using three levels of deductive content analysis (see figure 1 <ImgLink imgNo="1" imgType="figure" />), informed by a structured literature review. First, coders applied Young et al.&#39;s framework to determine the presence of CR <TextLink reference="2"></TextLink>. The aforementioned study identified six categories of terms regarding CR on which there was a consensus. These were: the purpose&#47;goal of reasoning; the outcome of reasoning; reasoning performance; reasoning processes; reasoning skills; and the context of reasoning <TextLink reference="2"></TextLink>. These categories and their associated themes served as a guideline to determine CR in our study.  Second, they assessed the correctness and coherence of reasoning, focusing on clarity and conclusiveness rather than accuracy alone. Correct CR did not only mention an action, but the action is justified in the context of clinical logic. Whereas in an incorrect CR response essential clinical considerations were missing or overlooked and therefore a wrong conclusion was made. Third, correct CRs were categorized as FR or BR following Beullens et al. <TextLink reference="3"></TextLink>. This study gave an example to distinguish FR and BR: An example of a data-driven reasoning &#91;BR&#93; statement is: &#8220;If he has an elevated blood sugar, then he must have diabetes&#8221;. An example of a hypothesis-driven reasoning &#91;FR&#93; statement is: &#8220;Because he has diabetes, he has an elevated blood sugar&#8220; <TextLink reference="3"></TextLink>. The coding guidelines also included the aspect to analyse if students justify their answers solely based on the answers provided (BR), or if the answer resulted from a more extensive clinical thought process (FR). The application of preexisting factual knowledge was coded as FR as a fast form of CR. This was based on the aspect of the Croskerry model, that repeated system 2 analyses, can become automatic system 1 responses (e.g., pattern recognition) <TextLink reference="23"></TextLink>. Initially, coders (JK, CD, USR, SH, FD, JJ) were trained via video and discussion. All had prior qualitative coding experience. Each response was coded independently by all six coders. In a second session, codes with at least 4&#47;6 agreement were accepted; discrepancies were discussed until full consensus was reached.</Pgraph><Pgraph>Quantitative data analysis was performed with jamovi<Superscript>TM</Superscript> version 2.4.12. The analysis included descriptive statistics of FR and BR frequencies, a median split to define performance groups, and (&#967;<Superscript>2</Superscript>) tests to examine group differences and CR types regarding follow-up questions and FF. Binomial&#47;multinomial logistic regressions tested whether follow-up questions or FF predicted CR type. </Pgraph></TextBlock>
    <TextBlock name="Methodik" linked="yes" language="de">
      <MainHeadline>Methodik</MainHeadline><SubHeadline>Setting und Studienteilnehmende</SubHeadline><Pgraph>In dieser Mixed-Methods-Studie waren alle Teilnehmer und Teilnehmerinnen Studierende im f&#252;nften Jahr des Medizinstudiums an der Universit&#228;t des Saarlandes (UdS). Die Pr&#252;fung war die obligatorische Jahresabschlusspr&#252;fung im Fach Allgemeinmedizin, eine digitale MCQ-Pr&#252;fung mit IMPP-Fragen (Institut f&#252;r medizinische und pharmazeutische Pr&#252;fungsfragen). Sie umfasste zwei identische Pr&#252;fungssettings mit jeweils 60 MCQs, die am Ende des Wintersemesters 2022&#47;2023 (WS 22&#47;23) und am Ende des Sommersemesters 2023 (SS 23) durchgef&#252;hrt wurden. Beide Pr&#252;fungen enthielten einen Forschungsteil, der aus zwei KFQs bestand. Bei diesen KFQs handelte es sich um kurze Fallbeschreibungen mit Folgefragen. Die verwendeten KFQs waren nicht identisch. Erstens, um ein breiteres Spektrum an Fragen in die Studie einzubeziehen. Zweitens, um zu verhindern, dass die Studierenden die Fragen durch Diskussionen zwischen den Semestern bereits kannten. In dieser Studie werden die Fragen mit einer Abk&#252;rzung bezeichnet. Die erste Zahl gibt die Nummer der Fallstudie an, die zweite die Nummer der Folgefrage. Nach jeder Folgefrage des KFQ folgte eine offene Textfeldfrage, in der die Studierenden selbst einsch&#228;tzen sollten, ob sie die Frage klinisch hergeleitet hatten und welchen kognitiven Denkprozess sie bei der vorherigen Frage angewendet hatten. Die gleiche Struktur galt f&#252;r die SS23-Pr&#252;fung. Zus&#228;tzlich erhielten die Studierenden in SS23 zum ersten Mal w&#228;hrend einer Pr&#252;fung f&#252;r eine Auswahl von Fragen FF. Das FF war ein einheitliches, informationsbasiertes Feedback, das aus der richtigen Antwort und einer kurzen Erkl&#228;rung bestand. Die Teilnehmenden wurden zuf&#228;llig in zwei Gruppen eingeteilt: A (n&#61;63) und B (n&#61;52). Gruppe A erhielt FF nach jeder Folgefrage des zweiten KFQ und Gruppe B erhielt FF nach jeder Folgefrage des ersten KFQ. In beiden Gruppen wurde FF in umgekehrter Reihenfolge bereitgestellt, um die Augenscheinvalidit&#228;t und Vergleichbarkeit von CR (mit und ohne FF) zu gew&#228;hrleisten. Die ethische Unbedenklichkeit wurde vor der Studie best&#228;tigt (234&#47;20-14.04.2022). Die Teilnehmenden stimmten vor der Pr&#252;fung der Verwendung ihrer Studien- und Pr&#252;fungsleistungen zu.</Pgraph><SubHeadline>Auswahl der MCQ-Fragen </SubHeadline><Pgraph>In Zusammenarbeit mit dem IMPP w&#228;hlte ein Gremium aus zwei Forschungsstudierenden (JK, CD) und vier Fakult&#228;tsmitgliedern der Allgemeinmedizin (SJ, SVW, FD, JJ) die Folge-KFQs aus einem vom IMPP bereitgestellten MCQ-Pool auf der Grundlage der Lernziele des Semesters aus. Die verwendeten Folge-KFQs wurden in Prozedere-, Diagnose- und Sachfragen unterteilt.</Pgraph><SubHeadline>Datenerhebung und -analyse</SubHeadline><Pgraph>Es wurden sowohl quantitative als auch qualitative Daten erhoben und anschlie&#223;end in Excel (Version 16.96.1) exportiert. Die qualitativen Daten aus beiden Pr&#252;fungen wurden anhand einer strukturierten Literaturrecherche mit Hilfe einer dreistufigen deduktiven Inhaltsanalyse (siehe Abbildung 1 <ImgLink imgNo="1" imgType="figure" />) ausgewertet. Zun&#228;chst wandten die Kodierer das Rahmenkonzept von Young et al. an, um das Vorhandensein von CR zu bestimmen <TextLink reference="2"></TextLink>. Die genannte Studie identifizierte sechs Kategorien von Begriffen in Bezug auf CR, &#252;ber die Konsens bestand. Diese waren: Zweck&#47;Ziel des Denkens; Ergebnis des Denkens; Denkleistung; Denkprozesse; Denkf&#228;higkeiten; und Kontext des Denkens <TextLink reference="2"></TextLink>. Diese Kategorien und die damit verbundenen Themen dienten als Leitfaden zur Bestimmung von CR in unserer Studie. Zweitens bewerteten sie die Richtigkeit und Koh&#228;renz des Denkens. Hierbei lag der Fokus auf Klarheit und Schl&#252;ssigkeit der Argumentation als auf alleiniger Genauigkeit. Korrekte CR erw&#228;hnten nicht nur eine Handlung, sondern die Handlung wurde auch im Kontext der klinischen Logik begr&#252;ndet. In einer falschen CR-Antwort fehlten hingegen wesentliche klinische &#220;berlegungen oder wurden &#252;bersehen, sodass eine falsche Schlussfolgerung gezogen wurde. Drittens wurden korrekte CRs nach Beullens et al. <TextLink reference="3"></TextLink> als FR oder BR kategorisiert. Diese Studie gab ein Beispiel zur Unterscheidung von FR und BR: &#8222;Ein Beispiel f&#252;r eine datengest&#252;tzte Argumentation &#91;BR&#93; ist: &#8222;Wenn er einen erh&#246;hten Blutzucker hat, dann muss er Diabetes haben&#8221;. Ein Beispiel f&#252;r eine hypothesengetriebene Argumentation &#91;FR&#93; ist: &#8222;Weil er Diabetes hat, hat er einen erh&#246;hten Blutzucker&#8221; <TextLink reference="3"></TextLink>. Die Kodierungsrichtlinien umfassten auch den Aspekt, zu analysieren, ob die Studierenden ihre Antworten ausschlie&#223;lich auf der Grundlage der vorgegebenen Antworten (BR) begr&#252;nden oder ob die Antwort das Ergebnis eines umfassenderen klinischen Denkprozesses (FR) ist. Die Anwendung bereits vorhandenen Faktenwissens wurde als FR als schnelle Form von CR kodiert. Dies basierte auf dem Aspekt des Croskerry-Modells, dass wiederholte System-2-Analysen zu automatischen System-1-Reaktionen werden k&#246;nnen (z. B. Mustererkennung) <TextLink reference="23"></TextLink>. Zun&#228;chst wurden die Kodierer (JK, CD, USR, SH, FD, JJ) per Video und Diskussion geschult. Alle hatten bereits Erfahrung mit qualitativer Kodierung. Jede Antwort wurde von allen sechs Kodierern unabh&#228;ngig voneinander kodiert. In einer zweiten Sitzung wurden Codes mit mindestens 4&#47;6 &#220;bereinstimmungen akzeptiert; Diskrepanzen wurden diskutiert, bis ein vollst&#228;ndiger Konsens erzielt wurde.</Pgraph><Pgraph>Die quantitative Datenanalyse wurde mit jamovi&#8482; Version 2.4.12 durchgef&#252;hrt. Die Analyse umfasste deskriptive Statistiken der FR- und BR-H&#228;ufigkeiten, eine Medianaufteilung der Punktzahl zur Definition von Leistungsgruppen und (&#967;<Superscript>2</Superscript>)-Tests zur Untersuchung von Gruppenunterschieden und CR-Typen in Bezug auf Folgefragen und FF. Binomiale&#47;multinomiale logistische Regressionen testeten, ob Folgefragen oder FF CR-Typen vorhersagen k&#246;nnen.</Pgraph></TextBlock>
    <TextBlock name="Results" linked="yes" language="en">
      <MainHeadline>Results</MainHeadline><Pgraph>The following results describe patterns of CR usage and differences in performance across two cohorts of students taking exams. It also examines the effects of feedback on one of these cohorts. In WS 22&#47;23 95 out of 97 participated, in SS 23 115 out of 115 participated. The average performance of the exam was comparable for the two semesters, with average scores of 80&#37; (WS 22&#47;23) and 84&#37; (SS 23) respectively. In total 4.95&#37; of the answers in WS 22&#47;23 and 1.44&#37; of the answers in SS23 were skipped.</Pgraph><SubHeadline>The use of clinical reasoning </SubHeadline><Pgraph>CR was observed across both exams. An example of an answer coded as CR regarding the diagnosis of an obstructive lung disease, was: &#8220;I looked at the Tiffeneau Index. Furthermore, inhalation of salbutamol did not result in any reversibility of the obstruction. This led me to the diagnosis of obstructive ventilation disorder.&#8221; (WS.21.40). An exemplary response coded as No CR regarding the same question was &#8220;&#91;I&#93; cannot clearly identify either obstruction or restriction; therefore &#91;I&#93; simply took a mixture.&#8221; (WS.21.73).</Pgraph><Pgraph>On average, the exam questions were answered with 87&#37; CR. As can be seen in figure 2 <ImgLink imgNo="2" imgType="figure" />, the highest proportion of CR usage was found in a procedural question (99.1&#37;), while the lowest was noted in a diagnostic question (73.5&#37;). In all questions, CR was applied more frequently than no CR. </Pgraph><Pgraph>The highest proportion of FR usage was found in a factual question (98.9&#37;), while the lowest was noted in a diagnostic question (66.7&#37;) (see figure 3 <ImgLink imgNo="3" imgType="figure" />). For BR, the highest usage was in a diagnostic question (33.3&#37;) and the lowest in a factual question (1.1&#37;). FR occurred significantly more often than BR, both in WS 22&#47;23 (p&#61;0.006) and SS 23 (p&#60;0.001). Two examples of coding for FR and BR regarding the further course of action in acute appendicitis were for FR: &#8220;Appendicitis should be treated surgically as quickly as possible; therefore, fasting upon admission to hospital&#8221; (SS.11.39) and for BR: &#8220;None of the other possible answers would have been appropriate in the case of acute appendicitis&#8221; (SS.11.96).</Pgraph><Pgraph>The fast form of FR, which consisted of the application of preexisting knowledge was coded in 3.5&#37; of the FR answers. </Pgraph><SubHeadline>High performers were more likely to apply CR</SubHeadline><Pgraph>Students scoring at or above the median were classified as high performers and those below as low performers. High performers were more likely to apply CR (FR and BR) than low performers. The odds of using FR and BR were 3.3 (OR&#61;3.33, 95&#37; CI &#91;2.378, 4.490&#93;, p&#60;0.001) and 2.7 times higher (OR&#61;2.67, 95&#37; CI &#91;1.669, 4.261&#93;, p&#60;0.001), respectively, for high performers. In one question in WS 22&#47;23, the high performers exclusively used FR. Moreover, students who applied any type of CR were more likely to answer a question correctly compared to students who did not use CR (p&#60;0.001). </Pgraph><SubHeadline>Feedback did not influence the use of CR</SubHeadline><Pgraph>A binomial logistic regression showed no significant correlation between FF and the use of CR (&#967;<Superscript>2</Superscript>&#61;1.78, p&#61;0.182). CR occurred neither more frequently after FF nor after no FF. A multinomial logistic regression showed no significant influence of FF on the choice of CR type (&#967;<Superscript>2</Superscript>&#61;3.38, p&#61;0.281). Neither the comparison between BR and &#8220;no CR&#8221; (p&#61;0.099), nor the comparison between FR and &#8220;no CR&#8221; (p&#61;0.227) reached statistical significance.</Pgraph><SubHeadline>Higher probability of BR in follow-up KFQs in one semester </SubHeadline><Pgraph>In SS 23, a significant difference was found in the frequency of FR and BR between the first questions (1.1, 2.1) and the follow-up KFQ (1.2, 2.2, 2.3, 2.4) (&#967;<Superscript>2</Superscript>&#61;256, p&#60; 0.001). Students applied BR significantly more often for follow-up questions than for the first question. The probability of BR was about 2.5 times higher when it was a follow-up question compared to a first question (OR&#61;2.49, 95&#37; CI &#91;2.29, 2.84&#93;, p&#60;0.001). In WS 22&#47;23, there was no significant difference in the frequency of FR and BR in relation to the first or follow-up questions (&#967;<Superscript>2</Superscript>&#61;1.08, p&#61;0.299). </Pgraph></TextBlock>
    <TextBlock name="Ergebnisse" linked="yes" language="de">
      <MainHeadline>Ergebnisse</MainHeadline><Pgraph>Die folgenden Ergebnisse beschreiben Muster der CR-Nutzung und Leistungsunterschiede zwischen zwei Kohorten von Studierenden, die Pr&#252;fungen abgelegt haben. Au&#223;erdem werden die Auswirkungen von Feedback auf eine dieser Kohorten untersucht. Im WS 22&#47;23 nahmen 95 von 97 Studierenden teil, im SS 23 nahmen 115 von 115 Studierenden teil. Die durchschnittliche Leistung der Pr&#252;fung war in beiden Semestern vergleichbar, mit Durchschnittswerten von 80&#37; (WS 22&#47;23) bzw. 84&#37; (SS 23). Insgesamt wurden 4,95&#37; der Fragen im WS 22&#47;23 und 1,44&#37; der Fragen im SS 23 nicht beantwortet.</Pgraph><SubHeadline>Die Anwendung von klinischem Denken </SubHeadline><Pgraph>CR wurde in beiden Pr&#252;fungen beobachtet. Ein Beispiel f&#252;r eine als CR kodierte Antwort bez&#252;glich der Diagnose einer obstruktiven Lungenerkrankung war: &#8222;Ich &#91;habe&#93; mir den Tiffeneau Index angeschaut &#91;&#8230;&#93;. Au&#223;erdem hat die Inhalation von Salbutamol zu keiner Reversibilit&#228;t der Obstruktion ergeben. Somit kam ich auf den Befund der obstruktiven Ventilationsst&#246;rung.&#8220; (WS.21.40). Eine beispielhafte Antwort, die in Bezug auf dieselbe Frage als &#8222;kein CR&#8220; kodiert wurde, lautete: &#8222;Ich finde weder Obstruktion noch Restriktion eindeutig daher &#91;habe ich&#93; einfach &#91;eine&#93; Mischung genommen.&#8220; (WS.21.73).</Pgraph><Pgraph>Im Durchschnitt wurden die Pr&#252;fungsfragen mit 87&#37; CR beantwortet. Wie aus Abbildung 2 <ImgLink imgNo="2" imgType="figure" /> hervorgeht, war der h&#246;chste Anteil an CR-Verwendungen bei einer Prozederefrage zu verzeichnen (99,1&#37;), w&#228;hrend der niedrigste Anteil bei einer Diagnosefrage festgestellt wurde (73,5&#37;). Bei allen Fragen wurde CR h&#228;ufiger angewendet als kein CR. </Pgraph><Pgraph>Der h&#246;chste Anteil an FR-Verwendung wurde bei einer Sachfrage (98,9&#37;) festgestellt, w&#228;hrend der niedrigste bei einer diagnostischen Frage (66,7&#37;) zu verzeichnen war (siehe Abbildung 3 <ImgLink imgNo="3" imgType="figure" />). Bei BR war die h&#246;chste Verwendung bei einer diagnostischen Frage (33,3&#37;) und die niedrigste bei einer Sachfrage (1,1&#37;) zu verzeichnen. FR kam sowohl in WS 22&#47;23 (p&#61;0,006) als auch in SS 23 (p&#60;0,001) signifikant h&#228;ufiger vor als BR. Zwei Beispiele f&#252;r die Kodierung von FR und BR hinsichtlich der weiteren Vorgehensweise bei einer akuten Blinddarmentz&#252;ndung waren f&#252;r FR: &#8222;Eine Appendizitis sollte schnellstm&#246;glich operativ therapiert werden, daher eine Nahrungskarenz bei &#91;Krankenhaus&#93; Einweisung&#8221; (SS.11.39) und f&#252;r BR: &#8222;Alle anderen angegeben Antwortm&#246;glichkeiten w&#228;ren bei einer akuten Appendizitis nicht angemessen gewesen&#8221; (SS.11.96).</Pgraph><Pgraph>Die schnelle Form von FR, die aus der Anwendung bereits vorhandenen Wissens bestand, wurde in 3,5&#37; der FR-Antworten kodiert. </Pgraph><SubHeadline>Leistungsstarke wandten CR h&#228;ufiger an</SubHeadline><Pgraph>Studierende, deren Punktzahl dem Median entsprach oder diesen &#252;berstieg, wurden als Leistungsstarke eingestuft, diejenigen darunter als Leistungsschwache. Leistungsstarke wandten CR (FR und BR) h&#228;ufiger an als Leistungsschwache. Die Wahrscheinlichkeit, FR und BR zu verwenden, betrug 3,3 (OR&#61;3,33, 95&#37; KI &#91;2,378, 4,490&#93;, p&#60;0,001) bzw. war 2,7-mal h&#246;her (OR&#61;2,67, 95&#37; KI &#91;1,669, 4,261&#93;, p&#60;0,001) f&#252;r Leistungsstarke. Bei einer Frage in WS 22&#47;23 verwendeten die Leistungsstarken ausschlie&#223;lich FR. Dar&#252;ber hinaus beantworteten Studierende, die irgendeine Art von CR anwendeten, eine Frage mit h&#246;herer Wahrscheinlichkeit richtig als Studierende, die keine CR verwendeten (p&#60;0,001). </Pgraph><SubHeadline>Feedback hatte keinen Einfluss auf die Verwendung von CR</SubHeadline><Pgraph>Eine binomiale logistische Regression zeigte keine signifikante Korrelation zwischen FF und der Verwendung von CR (&#967;<Superscript>2</Superscript>&#61;1,78, p&#61;0,182). CR kam weder nach FF noch nach keinem FF h&#228;ufiger vor. Eine multinomiale logistische Regression zeigte keinen signifikanten Einfluss von FF auf die Wahl der CR-Art (&#967;<Superscript>2</Superscript>&#61;3,38, p&#61;0,281). Weder der Vergleich zwischen BR und &#8222;kein CR&#8221; (p&#61;0,099) noch der Vergleich zwischen FR und &#8222;kein CR&#8221; (p&#61;0,227) erreichten statistische Signifikanz.</Pgraph><SubHeadline>H&#246;here Wahrscheinlichkeit von BR in Folge-KFQs in einem Semester</SubHeadline><Pgraph>In SS 23 wurde ein signifikanter Unterschied in der H&#228;ufigkeit von FR und BR zwischen den ersten Fragen (1.1, 2.1) und den Folge-KFQs (1.2, 2.2, 2.3, 2.4) festgestellt (&#967;<Superscript>2</Superscript>&#61;256, p&#60; 0,001). Die Studierenden wandten BR bei Folgefragen signifikant h&#228;ufiger an als bei der ersten Frage. Die Wahrscheinlichkeit von BR war bei Folgefragen etwa 2,5-mal h&#246;her als bei der ersten Frage (OR&#61;2,49, 95&#37; KI &#91;2,29, 2,84&#93;, p&#60;0,001). Im WS 22&#47;23 gab es keinen signifikanten Unterschied in der H&#228;ufigkeit von FR und BR in Bezug auf die ersten oder Folgefragen (&#967;<Superscript>2</Superscript>&#61;1,08, p&#61;0,299). </Pgraph></TextBlock>
    <TextBlock name="Discussion" linked="yes" language="en">
      <MainHeadline>Discussion</MainHeadline><Pgraph>This study yielded four main findings. First, family medicine students were able to demonstrate CR within a tablet-based assessment format. Second, high-performing students were more likely to apply CR, and the use of CR was associated with a better performance. Third, FF had not significantly influenced the type of CR employed. Fourth, follow-up questions were associated with an increased likelihood of BR.</Pgraph><Pgraph>The results demonstrate that CR can be effectively captured and analysed in a digital assessment environment. CR processes were visualized across an entire academic year, enabling simultaneous data collection from a large cohort during the examination. This approach offers a valuable alternative to traditional post-exam interviews and may reveal more efficiently students&#8217; CR processes. Contrary to common assumptions, the data suggests that medical students do not simply focus on answer options in MCQs <TextLink reference="24"></TextLink>. Instead, many actively engage in reasoning processes, as FR was used significantly more frequently than BR. In a factual question, FR was used most often. This may be attributed to the fact that a large proportion of students remember factual answers from learnt information. The application of preexisting factual knowledge was coded as FR as a fast form of CR. This is comparable to pattern recognition of the Croskerry model <TextLink reference="23"></TextLink>. Fewer students used FR in more complex questions. Consistent with existing literature, high performers relied more on FR than low performers <TextLink reference="3"></TextLink>. This supports the notion that FR is more typical for expert reasoning patterns <TextLink reference="15"></TextLink>. This could mean that the use of FR is situation dependent and that its application may increase with advancing competency levels (experts). These findings reinforce the importance of CR not only in clinical practice but also in undergraduate assessments. When students employed CR to answer a question, the likelihood of a correct answer increased. There is also evidence that FR may be more common among students who are able to think flexibly and apply knowledge creatively. For example, in WS 22&#47;23, in one question high performers exclusively used FR. According to the panel that selected the questions, this item required &#8220;thinking outside the box&#8221; and went beyond standard diagnostic or therapeutic content, promoting students to draw on clinical imagination or real-world experience such as internships.</Pgraph><Pgraph>However, modern question types such as KFQs, which include follow-up questions, do not inherently promote FR. On the contrary, follow-up questions can lead students to prematurely focus on a single hypothesis and the preset answer options. This phenomenon, known as premature closure, limits the consideration of differential diagnoses and leads to search satisfaction &#8211; where reasoning halts after identifying one plausible diagnosis <TextLink reference="25"></TextLink>. This may explain the increased likelihood of BR in response to follow-up questions in SS23. On the other hand, in WS 22&#47;23, there was no significant difference in the frequency of FR and BR between the first and follow-up questions. This revealed a difference between the two cohorts, illustrating how the structure and type of assessment items can influence the reasoning process. The use of different questions, coupled with an imbalanced mix of factual, diagnostic and procedural questions highlights the importance of carefully considering item design in medical examinations. Seemingly minor variations in question format can substantially influence whether students engage in FR or BR strategies. Even though both semesters were subject to the same family medicine curriculum, it is important to consider the possibility that the reasoning strategies employed in the two semesters may have been influenced by differing practical experiences. In addition, disparities in learning motivation or stress management may underpin the observed variation in the frequency of BR. In situations of uncertainty, the propensity to avoid errors may be augmented, thereby facilitating a process of thinking backwards or the promotion of BR. Group psychology that develops within a cohort through exchange, mentors, or so-called &#34;exam myths&#34; could also influence the reasoning strategies of the cohorts. While innovative competency-based formats may aim to assess higher-order reasoning, they do not automatically elicit authentic CR. </Pgraph><Pgraph>Similarly, the use of FF did not enhance CR in this study. While FF is known to support learning <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, the design of the FF may influence its effectiveness. In the assessment, students received uniform information-based feedback consisting of the correct answer and a brief explanation. Research shows that CR skills improve when feedback includes specific suggestions for improvement, regardless of students&#8217; performance <TextLink reference="26"></TextLink>. The lack of individualization or absence of suggestions for improvement may explain why the FF did not significantly influence the usage of CR or FR.</Pgraph><Pgraph>To confirm these findings, further research with larger and more diverse cohorts at different stages of undergraduate medical education is needed. Future studies should explore the impact of KFQ formats and varied feedback types across disciplines, while continuing to visualize CR at scale. </Pgraph><SubHeadline>Limitations </SubHeadline><Pgraph>The study focused on year five medical students within a Family Medicine curriculum in Germany. Family medicine, being a broad and integrative subject, may have contributed to the high point average (average scores of 80&#37; and 84&#37;). This could explain the high use of CR in general and FR in particular. Consequently, the data of this study may not be generalizable to students in other years, disciplines, or institutions. Furthermore, reasoning types (FR and BR) were coded based on students&#8217; written explanation of their reasoning, focusing on their initial train of thought. Although six independent coders were involved and inter-rater agreement of at least two-thirds was achieved for all responses, it is possible that nuances of reasoning were lost in the process. There is also potential for desirability bias. Another limitation of this study is that factual questions were only present in one of the two cohorts (SS23). The examination questions were selected from an IMPP item pool according to curricular relevance, while the categorization into factual, diagnostic, and procedural domains was only applied retrospectively for the analysis. Future studies should include a more balanced set of questions to enable advanced comparisons between cohorts.</Pgraph></TextBlock>
    <TextBlock name="Diskussion" linked="yes" language="de">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Diese Studie ergab vier wesentliche Erkenntnisse. Erstens konnten Studierende der Allgemeinmedizin CR innerhalb eines Tablet-basierten Bewertungsformats demonstrieren. Zweitens wandten leistungsstarke Studierende CR eher an, und die Anwendung von CR war mit einer besseren Leistung verbunden. Drittens hatte FF keinen signifikanten Einfluss auf die Art der angewandten CR. Viertens waren Folgefragen mit einer erh&#246;hten Wahrscheinlichkeit von BR verbunden.</Pgraph><Pgraph>Die Ergebnisse zeigen, dass CR in einer digitalen Bewertung effektiv erfasst und analysiert werden kann. CR-Prozesse wurden &#252;ber eine gesamte Semesterpopulation hinweg visualisiert, was die gleichzeitige Datenerfassung einer gro&#223;en Kohorte w&#228;hrend der Pr&#252;fung erm&#246;glichte. Dieser Ansatz bietet eine wertvolle Alternative zu traditionellen Interviews nach der Pr&#252;fung und kann die CR-Prozesse der Studierenden effizienter aufzeigen. Entgegen der allgemeinen Annahme deuten die Daten darauf hin, dass Medizinstudierende sich nicht einfach auf die Antwortm&#246;glichkeiten in MCQs konzentrieren <TextLink reference="24"></TextLink>. Stattdessen besch&#228;ftigen sich viele aktiv mit Denkprozessen, da FR deutlich h&#228;ufiger als BR verwendet wurde. Bei einer Sachfrage wurde FR am h&#228;ufigsten verwendet. Dies kann darauf zur&#252;ckgef&#252;hrt werden, dass sich ein gro&#223;er Teil der Studierenden an sachliche Antworten aus gelernten Informationen erinnert. Die Anwendung von bereits vorhandenem Sachwissen wurde als FR als schnelle Form des CR kodiert. Dies ist vergleichbar mit der Mustererkennung des Croskerry-Modells <TextLink reference="23"></TextLink>. Bei komplexeren Fragen verwendeten weniger Studierende FR. In &#220;bereinstimmung mit der vorhandenen Literatur verlie&#223;en sich leistungsstarke Studierende st&#228;rker auf FR als leistungsschwache Studierende <TextLink reference="3"></TextLink>. Dies st&#252;tzt die Annahme, dass FR eher f&#252;r die Argumentationsmuster von Experten typisch ist <TextLink reference="15"></TextLink>. Dies k&#246;nnte bedeuten, dass die Verwendung von FR situationsabh&#228;ngig ist und dass seine Anwendung mit steigendem Kompetenzniveau (Experten) zunimmt. Diese Ergebnisse unterstreichen die Bedeutung von CR nicht nur in der klinischen Praxis, sondern auch bei der Bewertung von Studierenden. Wenn Studierende CR zur Beantwortung einer Frage einsetzten, stieg die Wahrscheinlichkeit einer richtigen Antwort. Die Studie ergab Hinweise darauf, dass FR bei Studierenden, die flexibel denken und Wissen kreativ anwenden k&#246;nnen, h&#228;ufiger vorkommt. Im WS 22&#47;23 verwendeten beispielsweise leistungsstarke Studierende bei einer Frage ausschlie&#223;lich FR. Nach Ansicht des Gremiums, das die Fragen ausgew&#228;hlt hatte, erforderte diese Frage &#8222;unkonventionelles Denken&#8221; und ging &#252;ber den &#252;blichen diagnostischen oder therapeutischen Inhalt hinaus, sodass die Studierenden ihre klinische Vorstellungskraft oder praktische Erfahrungen, beispielsweise aus Praktika, einbringen mussten.</Pgraph><Pgraph>Moderne Fragetypen wie KFQs, die Folgefragen enthalten, f&#246;rdern jedoch nicht von Natur aus FR. Im Gegenteil, Folgefragen k&#246;nnen dazu f&#252;hren, dass sich Studierende vorzeitig auf eine einzige Hypothese und die vorgegebenen Antwortoptionen konzentrieren. Dieses als &#8222;vorzeitiger Abschluss&#8221; bekannte Ph&#228;nomen schr&#228;nkt die Ber&#252;cksichtigung von Differentialdiagnosen ein und f&#252;hrt zu &#8222;Suchbefriedigung&#8221; &#8211; wobei das Denken nach der Identifizierung einer plausiblen Diagnose zum Stillstand kommt <TextLink reference="25"></TextLink>. Dies k&#246;nnte die erh&#246;hte Wahrscheinlichkeit von BR als Antwort auf Folgefragen in SS23 erkl&#228;ren. Andererseits gab es im WS 22&#47;23 keinen signifikanten Unterschied in der H&#228;ufigkeit von FR und BR zwischen den ersten und den Folgefragen. Dies zeigt einen Unterschied zwischen den beiden Kohorten und veranschaulichte, wie die Struktur und die Art der Pr&#252;fungsaufgaben den Denkprozess beeinflussen k&#246;nnen. Die Verwendung unterschiedlicher Fragen in Verbindung mit einer unausgewogenen Mischung aus sachlichen, diagnostischen und prozeduralen Fragen unterstreicht, wie wichtig es ist, die Gestaltung der Fragen in medizinischen Pr&#252;fungen sorgf&#228;ltig zu &#252;berdenken. Scheinbar geringf&#252;gige Abweichungen im Frageformat k&#246;nnen einen erheblichen Einfluss darauf haben, ob Studierende FR- oder BR-Strategien anwenden. Auch wenn beide Semester dem gleichen Lehrplan f&#252;r Allgemeinmedizin unterlagen, muss ber&#252;cksichtigt werden, dass die in den beiden Semestern angewandten Argumentationsstrategien m&#246;glicherweise durch unterschiedliche praktische Erfahrungen beeinflusst wurden. Dar&#252;ber hinaus k&#246;nnten Unterschiede in der Lernmotivation oder im Stressmanagement die beobachteten Abweichungen in der H&#228;ufigkeit von BR begr&#252;nden. In Situationen der Unsicherheit kann die Neigung, Fehler zu vermeiden, verst&#228;rkt sein, was einen Prozess des R&#252;ckw&#228;rtsdenkens oder die F&#246;rderung von BR beg&#252;nstigt. Die Gruppenpsychologie, die sich innerhalb einer Kohorte durch Austausch, Mentoren oder sogenannte &#8222;Pr&#252;fungsmythen&#8221; entwickelt, k&#246;nnte ebenfalls die Denkstrategien der Kohorten beeinflussen. Innovative kompetenzbasierte Formate zielen zwar darauf ab, das Denken auf h&#246;herer Ebene zu bewerten, f&#252;hren jedoch nicht automatisch zu authentischem CR. </Pgraph><Pgraph>Ebenso hat der Einsatz von FF in dieser Studie das CR nicht verbessert. Obwohl FF bekannterma&#223;en das Lernen unterst&#252;tzt <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, kann die Gestaltung des FF dessen Wirksamkeit beeinflussen. Bei der Bewertung erhielten die Studierenden einheitliches, informationsbasiertes Feedback, das aus der richtigen Antwort und einer kurzen Erkl&#228;rung bestand. Untersuchungen zeigen, dass sich die CR-F&#228;higkeiten verbessern, wenn das Feedback spezifische Verbesserungsvorschl&#228;ge enth&#228;lt, unabh&#228;ngig von der Leistung der Studierenden <TextLink reference="26"></TextLink>. Der Mangel an Individualisierung oder das Fehlen von Verbesserungsvorschl&#228;gen k&#246;nnte erkl&#228;ren, warum das FF keinen signifikanten Einfluss auf die Nutzung von CR oder FR hatte.</Pgraph><Pgraph>Um diese Ergebnisse zu best&#228;tigen, sind weitere Untersuchungen mit gr&#246;&#223;eren und vielf&#228;ltigeren Kohorten in verschiedenen Phasen des Medizinstudiums erforderlich. Zuk&#252;nftige Studien sollten die Auswirkungen von KFQ-Formaten und unterschiedlichen Arten von Feedback in verschiedenen Fachbereichen untersuchen und die Visualisierung von CR in gro&#223;em Ma&#223;stab weiterf&#252;hren. </Pgraph><SubHeadline>Limitationen</SubHeadline><Pgraph>Die Studie konzentrierte sich auf Medizinstudierende im f&#252;nften Jahr im Fach Allgemeinmedizin in Deutschland. Die Allgemeinmedizin ist ein breites und integratives Fachgebiet, was m&#246;glicherweise zu den hohen durchschnittlichen Leistungen (Durchschnittswerten von 80&#37; und 84&#37;) beigetragen hat. Dies k&#246;nnte die h&#228;ufige Verwendung von CR im Allgemeinen und FR im Besonderen erkl&#228;ren. Folglich lassen sich die Daten dieser Studie m&#246;glicherweise nicht auf Studierende anderer Jahrg&#228;nge, Fachrichtungen oder Institutionen &#252;bertragen. Dar&#252;ber hinaus wurden die Argumentationstypen (FR und BR) auf der Grundlage der schriftlichen Erl&#228;uterungen der Studierenden zu ihrer Argumentation kodiert, wobei der Schwerpunkt auf ihrem urspr&#252;nglichen Gedankengang lag. Obwohl sechs unabh&#228;ngige Kodierer und Kodiererinnen beteiligt waren und f&#252;r alle Antworten eine &#220;bereinstimmung von mindestens zwei Dritteln erreicht wurde, ist es m&#246;glich, dass dabei Nuancen der Argumentation verloren gegangen sind. Es besteht auch die M&#246;glichkeit einer Verzerrung aufgrund von sozialer Erw&#252;nschtheit (desirability bias). Eine weitere Einschr&#228;nkung dieser Studie besteht darin, dass Faktenfragen nur in einer der beiden Kohorten (SS23) vorkamen. Die Pr&#252;fungsfragen wurden anhand ihrer Relevanz f&#252;r den Lehrplan aus einem IMPP-Fragenpool ausgew&#228;hlt, w&#228;hrend die Einteilung in Fakten-, Diagnose- und Verfahrensbereiche erst nachtr&#228;glich f&#252;r die Analyse vorgenommen wurde. Zuk&#252;nftige Studien sollten einen ausgewogeneren Fragenkatalog enthalten, um weitergehende Vergleiche zwischen den Kohorten zu erm&#246;glichen.</Pgraph></TextBlock>
    <TextBlock name="Conclusion" linked="yes" language="en">
      <MainHeadline>Conclusion</MainHeadline><Pgraph>The findings indicate that careful assessment setup choices can and should be used to foster conscious CR choices in students. Digital assessments have additional potential to effectively visualize CR. This large-scale CR visualization may complement the quality screening of MCQ, especially for future high-stakes exams. Further research into large scale CR visualization may help to better understand student performance differences and it may help individualize standardized assessments. CR visualization may also help align MCQ CR with clinical practice and therefore increase its value for workplace training.</Pgraph></TextBlock>
    <TextBlock name="Schlussfolgerung" linked="yes" language="de">
      <MainHeadline>Schlussfolgerung</MainHeadline><Pgraph>Die Ergebnisse deuten darauf hin, dass sorgf&#228;ltige Entscheidungen bei der Gestaltung der Pr&#252;fungen getroffen werden k&#246;nnen und sollten, um bewusste CR-Entscheidungen bei den Studierenden zu f&#246;rdern. Digitale Pr&#252;fungsformate bieten zus&#228;tzliches Potenzial f&#252;r eine effektive Visualisierung des CR. Diese gro&#223; angelegte CR-Visualisierung kann die Qualit&#228;tspr&#252;fung von MCQ erg&#228;nzen, insbesondere bei zuk&#252;nftigen Pr&#252;fungen mit hoher Bedeutung. Weitere Forschungen zur gro&#223; angelegten CR-Visualisierung k&#246;nnen zu einem besseren Verst&#228;ndnis der Leistungsunterschiede zwischen den Studierenden und zur Individualisierung standardisierter Bewertungen beitragen. Die CR-Visualisierung kann auch dazu beitragen, die MCQs an die klinische Praxis anzupassen und somit ihren Wert f&#252;r die Ausbildung am Arbeitsplatz zu steigern.</Pgraph></TextBlock>
    <TextBlock name="Abbreviations" linked="yes" language="en">
      <MainHeadline>Abbreviations</MainHeadline><Pgraph><UnorderedList><ListItem level="1">WS: Winter semester </ListItem><ListItem level="1">SS: Summer semester </ListItem><ListItem level="1">CR: Clinical reasoning </ListItem><ListItem level="1">FR: Forward reasoning </ListItem><ListItem level="1">BR: Backward reasoning </ListItem><ListItem level="1">IMPP: Institut f&#252;r medizinische und pharmazeutische Pr&#252;fungsfragen (German Institute for State Examinations in Medicine, Pharmacy, Dentistry and Psychotherapy (IMPP))</ListItem><ListItem level="1">MCQ: Multiple choice question</ListItem><ListItem level="1">KFQ: Key feature question</ListItem><ListItem level="1">Wonca: World Organisation of National Colleges of Family Medicine</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="Abk&#252;rzungen" linked="yes" language="de">
      <MainHeadline>Abk&#252;rzungen</MainHeadline><Pgraph><UnorderedList><ListItem level="1">WS: Wintersemester </ListItem><ListItem level="1">SS: Sommersemester </ListItem><ListItem level="1">CR: klinisches Denken&#47; Clinical reasoning </ListItem><ListItem level="1">FR: Vorw&#228;rtsdenken&#47; Forward reasoning </ListItem><ListItem level="1">BR: R&#252;ckw&#228;rtsdenken&#47; Backward reasoning </ListItem><ListItem level="1">IMPP: Institut f&#252;r medizinische und pharmazeutische Pr&#252;fungsfragen </ListItem><ListItem level="1">MCQ: Multiple Choice Question</ListItem><ListItem level="1">KFQ: Key Feature Question</ListItem><ListItem level="1">Wonca: World Organisation of National Colleges of Family Medicine</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="Authors&#8217; ORCIDs" linked="yes" language="en">
      <MainHeadline>Authors&#8217; ORCIDs</MainHeadline><Pgraph><UnorderedList><ListItem level="1">Alexander Oksche: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-4592-1770">0000-0003-4592-1770</Hyperlink>&#93;</ListItem><ListItem level="1">Fabian Dupont: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-2247-5640">0000-0003-2247-5640</Hyperlink>&#93;</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="ORCIDs der Autoren" linked="yes" language="de">
      <MainHeadline>ORCIDs der Autoren</MainHeadline><Pgraph><UnorderedList><ListItem level="1">Alexander Oksche: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-4592-1770">0000-0003-4592-1770</Hyperlink>&#93;</ListItem><ListItem level="1">Fabian Dupont: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-2247-5640">0000-0003-2247-5640</Hyperlink>&#93;</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="Competing interests" linked="yes" language="en">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests. </Pgraph><Pgraph>FD is current Wonca World executive member and director &#38; Wonca World young doctor lead.</Pgraph></TextBlock>
    <TextBlock name="Interessenkonflikt" linked="yes" language="de">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autor&#42;innen erkl&#228;ren, dass sie keinen Interessenkonflikt im Zusammenhang mit diesem Artikel haben.</Pgraph><Pgraph>FD ist derzeit Vorstandsmitglied von Wonca World sowie Direktor und Leiter des Bereichs &#8222;Junge &#196;rzte&#8220; bei Wonca World.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Hawks MK</RefAuthor>
        <RefAuthor>Maciuba JM</RefAuthor>
        <RefAuthor>Merkebu J</RefAuthor>
        <RefAuthor>Durning SJ</RefAuthor>
        <RefAuthor>Mallory R</RefAuthor>
        <RefAuthor>Arnold MJ</RefAuthor>
        <RefAuthor>Torre D</RefAuthor>
        <RefAuthor>Soh M</RefAuthor>
        <RefTitle>Clinical Reasoning Curricula in Preclinical Undergraduate Medical Education: A Scoping Review</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>958-965</RefPage>
        <RefTotal>Hawks MK, Maciuba JM, Merkebu J, Durning SJ, Mallory R, Arnold MJ, Torre D, Soh M. Clinical Reasoning Curricula in Preclinical Undergraduate Medical Education: A Scoping Review. Acad Med. 2023;98(8):958-965. DOI: 10.1097&#47;ACM.0000000000005197</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0000000000005197</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Young M</RefAuthor>
        <RefAuthor>Thomas A</RefAuthor>
        <RefAuthor>Gordon D</RefAuthor>
        <RefAuthor>Gruppen L</RefAuthor>
        <RefAuthor>Lubarsky S</RefAuthor>
        <RefAuthor>Rencic J</RefAuthor>
        <RefAuthor>Ballard T</RefAuthor>
        <RefAuthor>Holmboe E</RefAuthor>
        <RefAuthor>Da Silva A</RefAuthor>
        <RefAuthor>Ratcliffe T</RefAuthor>
        <RefAuthor>Schuwirth L</RefAuthor>
        <RefAuthor>Durning SJ</RefAuthor>
        <RefTitle>The terminology of clinical reasoning in health professions education: implications and considerations</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>1277-1284</RefPage>
        <RefTotal>Young M, Thomas A, Gordon D, Gruppen L, Lubarsky S, Rencic J, Ballard T, Holmboe E, Da Silva A, Ratcliffe T, Schuwirth L, Durning SJ. The terminology of clinical reasoning in health professions education: implications and considerations. Med Teach. 2019;41(11):1277-1284. DOI: 10.1080&#47;0142159X.2019.1635686</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;0142159X.2019.1635686</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Beullens J</RefAuthor>
        <RefAuthor>Struyf E</RefAuthor>
        <RefAuthor>Van Damme B</RefAuthor>
        <RefTitle>Do extended matching multiple-choice questions measure clinical reasoning&#63;</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>410-417</RefPage>
        <RefTotal>Beullens J, Struyf E, Van Damme B. Do extended matching multiple-choice questions measure clinical reasoning&#63; Med Educ. 2005;39(4):410-417. DOI: 10.1111&#47;j.1365-2929.2005.02089.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2929.2005.02089.x</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Connor DM</RefAuthor>
        <RefAuthor>Durning SJ</RefAuthor>
        <RefAuthor>Rencic JJ</RefAuthor>
        <RefTitle>Clinical reasoning as a core competency</RefTitle>
        <RefYear>2020</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>1166-1171</RefPage>
        <RefTotal>Connor DM, Durning SJ, Rencic JJ. Clinical reasoning as a core competency. Acad Med. 2020;95(8):1166-1171. DOI: 10.1097&#47;ACM.0000000000003027</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0000000000003027</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Eva KW</RefAuthor>
        <RefTitle>What every teacher needs to know about clinical reasoning</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>98-106</RefPage>
        <RefTotal>Eva KW. What every teacher needs to know about clinical reasoning. Med Educ. 2005;39(1):98-106. DOI: 10.1111&#47;j.1365-2929.2004.01972.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2929.2004.01972.x</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Guth TA</RefAuthor>
        <RefAuthor>Wolfe RM</RefAuthor>
        <RefAuthor>Martinez O</RefAuthor>
        <RefAuthor>Subhiyah RG</RefAuthor>
        <RefAuthor>Henderek JJ</RefAuthor>
        <RefAuthor>McAllister C</RefAuthor>
        <RefAuthor>Roussel D</RefAuthor>
        <RefTitle>Assessment of Clinical Reasoning in Undergraduate Medical Education: A Pragmatic Approach to Programmatic Assessment</RefTitle>
        <RefYear>2024</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>912-921</RefPage>
        <RefTotal>Guth TA, Wolfe RM, Martinez O, Subhiyah RG, Henderek JJ, McAllister C, Roussel D. Assessment of Clinical Reasoning in Undergraduate Medical Education: A Pragmatic Approach to Programmatic Assessment. Acad Med. 2024;99(8):912-921. DOI: 10.1097&#47;ACM.0000000000005665</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0000000000005665</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Daniel M</RefAuthor>
        <RefAuthor>Rencic J</RefAuthor>
        <RefAuthor>Durning SJ</RefAuthor>
        <RefAuthor>Holmboe E</RefAuthor>
        <RefAuthor>Santen SA</RefAuthor>
        <RefAuthor>Lang V</RefAuthor>
        <RefAuthor>Ratcliffe T</RefAuthor>
        <RefAuthor>Gordon D</RefAuthor>
        <RefAuthor>Heist B</RefAuthor>
        <RefAuthor>Lubarsky S</RefAuthor>
        <RefAuthor>Estrada CA</RefAuthor>
        <RefAuthor>Ballard T</RefAuthor>
        <RefAuthor>Artino Jr AR</RefAuthor>
        <RefAuthor>Sergio Da Silva A</RefAuthor>
        <RefAuthor>Cleary T</RefAuthor>
        <RefAuthor>Stojan J</RefAuthor>
        <RefAuthor>Gruppen LD</RefAuthor>
        <RefTitle>Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>902-912</RefPage>
        <RefTotal>Daniel M, Rencic J, Durning SJ, Holmboe E, Santen SA, Lang V, Ratcliffe T, Gordon D, Heist B, Lubarsky S, Estrada CA, Ballard T, Artino Jr AR, Sergio Da Silva A, Cleary T, Stojan J, Gruppen LD. Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance. Acad Med. 2019;94(6):902-912. DOI: 10.1097&#47;ACM.0000000000002618</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0000000000002618</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Mee J</RefAuthor>
        <RefAuthor>Pandian R</RefAuthor>
        <RefAuthor>Wolczynski J</RefAuthor>
        <RefAuthor>Morales A</RefAuthor>
        <RefAuthor>Paniagua M</RefAuthor>
        <RefAuthor>Harik P</RefAuthor>
        <RefAuthor>Baldwin P</RefAuthor>
        <RefAuthor>Clauser BE</RefAuthor>
        <RefTitle>An experimental comparison of multiple-choice and short-answer questions on a high-stakes test for medical students</RefTitle>
        <RefYear>2024</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>783-801</RefPage>
        <RefTotal>Mee J, Pandian R, Wolczynski J, Morales A, Paniagua M, Harik P, Baldwin P, Clauser BE. An experimental comparison of multiple-choice and short-answer questions on a high-stakes test for medical students. Adv Health Sci Educ Theory Pract. 2024;29(3):783-801. DOI: 10.1007&#47;s10459-023-10266-3</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s10459-023-10266-3</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Hrynchak P</RefAuthor>
        <RefAuthor>Glover Takahashi S</RefAuthor>
        <RefAuthor>Nayer M</RefAuthor>
        <RefTitle>Key-feature questions for assessment of clinical reasoning: A literature review</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>870-883</RefPage>
        <RefTotal>Hrynchak P, Glover Takahashi S, Nayer M. Key-feature questions for assessment of clinical reasoning: A literature review. Med Educ. 2014;48(9):870-883. DOI: 10.1111&#47;medu.12509</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;medu.12509</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Ricketts C</RefAuthor>
        <RefAuthor>Brice J</RefAuthor>
        <RefAuthor>Coombes L</RefAuthor>
        <RefTitle>Are multiple choice tests fair to medical students with specific learning disabilities&#63;</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>265-275</RefPage>
        <RefTotal>Ricketts C, Brice J, Coombes L. Are multiple choice tests fair to medical students with specific learning disabilities&#63; Adv Health Sci Educ Theory Pract. 2010;15(2):265-275. DOI: 10.1007&#47;s10459-009-9197-8</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s10459-009-9197-8</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Chenot JF</RefAuthor>
        <RefTitle>Undergraduate medical education in Germany</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Ger Med Sci</RefJournal>
        <RefPage>Doc02</RefPage>
        <RefTotal>Chenot JF. Undergraduate medical education in Germany. Ger Med Sci. 2009;7:Doc02. DOI: 10.3205&#47;000061</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3205&#47;000061</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Salam A</RefAuthor>
        <RefAuthor>Yousuf R</RefAuthor>
        <RefAuthor>Bakar SA</RefAuthor>
        <RefTitle>Multiple choice questions in medical education: how to construct high quality questions</RefTitle>
        <RefYear>2020</RefYear>
        <RefJournal>Int J Hum Health Sci</RefJournal>
        <RefPage>79</RefPage>
        <RefTotal>Salam A, Yousuf R, Bakar SA. Multiple choice questions in medical education: how to construct high quality questions. Int J Hum Health Sci. 2020;4(2):79. DOI: 10.31344&#47;ijhhs.v4i2.180</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.31344&#47;ijhhs.v4i2.180</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Law AK</RefAuthor>
        <RefAuthor>So J</RefAuthor>
        <RefAuthor>Lui CT</RefAuthor>
        <RefAuthor>Choi YF</RefAuthor>
        <RefAuthor>Cheung KH</RefAuthor>
        <RefAuthor>Hung KK</RefAuthor>
        <RefAuthor>Graham CA</RefAuthor>
        <RefTitle>AI versus human-generated multiple-choice questions for medical education: a cohort study in a high-stakes examination</RefTitle>
        <RefYear>2025</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>208</RefPage>
        <RefTotal>Law AK, So J, Lui CT, Choi YF, Cheung KH, Hung KK, Graham CA. AI versus human-generated multiple-choice questions for medical education: a cohort study in a high-stakes examination. BMC Med Educ. 2025;25(1):208. DOI: 10.1186&#47;s12909-025-06796-6</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-025-06796-6</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Patel VL</RefAuthor>
        <RefAuthor>Groen GJ</RefAuthor>
        <RefAuthor>Arocha JF</RefAuthor>
        <RefTitle>Medical expertise a sa function of task difficulty</RefTitle>
        <RefYear>1990</RefYear>
        <RefJournal>Mem Cognit</RefJournal>
        <RefPage>394-406</RefPage>
        <RefTotal>Patel VL, Groen GJ, Arocha JF. Medical expertise as a function of task difficulty. Mem Cognit. 1990;18(4):394-406. DOI: 10.3758&#47;bf03197128</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3758&#47;bf03197128</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Shin HS</RefAuthor>
        <RefTitle>Reasoning processes in clinical reasoning: from the perspective of cognitive psychology</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Korean J Med Educ</RefJournal>
        <RefPage>299-308</RefPage>
        <RefTotal>Shin HS. Reasoning processes in clinical reasoning: from the perspective of cognitive psychology. Korean J Med Educ. 2019;31(4):299-308. DOI: 10.3946&#47;kjme.2019.140</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3946&#47;kjme.2019.140</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Al-Wardy NM</RefAuthor>
        <RefTitle>Assessment methods in undergraduate medical education</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Sultan Qaboos Univ Med J</RefJournal>
        <RefPage>203-209</RefPage>
        <RefTotal>Al-Wardy NM. Assessment methods in undergraduate medical education. Sultan Qaboos Univ Med J. 2010;10(2):203-209.</RefTotal>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Murugesan M</RefAuthor>
        <RefAuthor>David PL</RefAuthor>
        <RefAuthor>Chitra CB</RefAuthor>
        <RefTitle>Correlation between Formative and Summative Assessment Results by Post Validation in Medical Undergraduates</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>IOSR J Dent Med Sci</RefJournal>
        <RefPage>51-57</RefPage>
        <RefTotal>Murugesan M, David PL, Chitra CB. Correlation between Formative and Summative Assessment Results by Post Validation in Medical Undergraduates. IOSR J Dent Med Sci. 2021;20(9):51-57. DOI: 10.9790&#47;0853-2009055157</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.9790&#47;0853-2009055157</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Badyal DK</RefAuthor>
        <RefAuthor>Bala S</RefAuthor>
        <RefAuthor>Singh T</RefAuthor>
        <RefAuthor>Gulrez G</RefAuthor>
        <RefTitle>Impact of immediate feedback on the learning of medical students in pharmacology</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>J Adv Med Educ Prof</RefJournal>
        <RefPage>1-6</RefPage>
        <RefTotal>Badyal DK, Bala S, Singh T, Gulrez G. Impact of immediate feedback on the learning of medical students in pharmacology. J Adv Med Educ Prof. 2019;7(1):1-6. DOI: 10.30476&#47;JAMP.2019.41036</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.30476&#47;JAMP.2019.41036</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Chauhan GR</RefAuthor>
        <RefAuthor>Chauhan BR</RefAuthor>
        <RefAuthor>Vaza JV</RefAuthor>
        <RefAuthor>Chauhan PR</RefAuthor>
        <RefTitle>Relations of the Number of Functioning Distractors With the Item Difficulty Index and the Item Discrimination Power in the Multiple Choice Questions</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>Cureus</RefJournal>
        <RefPage>e42492</RefPage>
        <RefTotal>Chauhan GR, Chauhan BR, Vaza JV, Chauhan PR. Relations of the Number of Functioning Distractors With the Item Difficulty Index and the Item Discrimination Power in the Multiple Choice Questions. Cureus. 2023;15(7):e42492. DOI: 10.7759&#47;cureus.42492</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.7759&#47;cureus.42492</RefLink>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Rao C</RefAuthor>
        <RefAuthor>Kishan Prasad H</RefAuthor>
        <RefAuthor>Sajitha K</RefAuthor>
        <RefAuthor>Permi H</RefAuthor>
        <RefAuthor>Shetty J</RefAuthor>
        <RefTitle>Item analysis of multiple choice questions: Assessing an assessment tool in medical students</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>Int J Educ Psychol Res</RefJournal>
        <RefPage>201-204</RefPage>
        <RefTotal>Rao C, Kishan Prasad H, Sajitha K, Permi H, Shetty J. Item analysis of multiple choice questions: Assessing an assessment tool in medical students. Int J Educ Psychol Res. 2016;2(4):201-204. DOI: 10.18203&#47;2320-6012.ijrms20161256</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.18203&#47;2320-6012.ijrms20161256</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Heist BS</RefAuthor>
        <RefAuthor>Gonzalo JD</RefAuthor>
        <RefAuthor>Durning S</RefAuthor>
        <RefAuthor>Torre D</RefAuthor>
        <RefAuthor>Elnicki DM</RefAuthor>
        <RefTitle>Exploring Clinical Reasoning Strategies and Test-Taking Behaviors During Clinical Vignette Style Multiple-Choice Examinations: A Mixed Methods Study</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>J Grad Med Educ</RefJournal>
        <RefPage>709-714</RefPage>
        <RefTotal>Heist BS, Gonzalo JD, Durning S, Torre D, Elnicki DM. Exploring Clinical Reasoning Strategies and Test-Taking Behaviors During Clinical Vignette Style Multiple-Choice Examinations: A Mixed Methods Study. J Grad Med Educ. 2014;6(4):709-714. DOI: 10.4300&#47;JGME-D-14-00176.1</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.4300&#47;JGME-D-14-00176.1</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Torre D</RefAuthor>
        <RefAuthor>Daniel M</RefAuthor>
        <RefAuthor>Ratcliffe T</RefAuthor>
        <RefAuthor>Durning SJ</RefAuthor>
        <RefAuthor>Holmboe E</RefAuthor>
        <RefAuthor>Schuwirth L</RefAuthor>
        <RefTitle>Programmatic Assessment of Clinical Reasoning: New Opportunities to Meet an Ongoing Challenge</RefTitle>
        <RefYear>2025</RefYear>
        <RefJournal>Teach Learn Med</RefJournal>
        <RefPage>403-411</RefPage>
        <RefTotal>Torre D, Daniel M, Ratcliffe T, Durning SJ, Holmboe E, Schuwirth L. Programmatic Assessment of Clinical Reasoning: New Opportunities to Meet an Ongoing Challenge. Teach Learn Med. 2025;37(3):403-411. DOI: 10.1080&#47;10401334.2024.2333921</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;10401334.2024.2333921</RefLink>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Croskerry P</RefAuthor>
        <RefTitle>Critical thinking and reasoning in emergency medicine</RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Patient safety in emergency medicine</RefBookTitle>
        <RefPage>213-218</RefPage>
        <RefTotal>Croskerry P. Critical thinking and reasoning in emergency medicine. In: Croskerry P, Cosby KS, Schenkel SM, Wears RL, editors. Patient safety in emergency medicine. Philadelphia, PA: Lippincott Williams &#38; Wilkins; 2008. p.213-218.</RefTotal>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>van Wijk EV</RefAuthor>
        <RefAuthor>Janse RJ</RefAuthor>
        <RefAuthor>Ruijter BN</RefAuthor>
        <RefAuthor>Rohling JH</RefAuthor>
        <RefAuthor>van der Kraan J</RefAuthor>
        <RefAuthor>Crobach S</RefAuthor>
        <RefAuthor>de Jonge M</RefAuthor>
        <RefAuthor>de Beaufort AJ</RefAuthor>
        <RefAuthor>Dekker FW</RefAuthor>
        <RefAuthor>Lagers AM</RefAuthor>
        <RefTitle>Use of very short answer questions compared to multiple choice questions in undergraduate medical students: an external validation study</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>PLoS One</RefJournal>
        <RefPage>e0288558</RefPage>
        <RefTotal>van Wijk EV, Janse RJ, Ruijter BN, Rohling JH, van der Kraan J, Crobach S, de Jonge M, de Beaufort AJ, Dekker FW, Lagers AM. Use of very short answer questions compared to multiple choice questions in undergraduate medical students: an external validation study. PLoS One. 2023;18(7):e0288558. DOI: 10.1371&#47;journal.pone.0288558</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1371&#47;journal.pone.0288558</RefLink>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Prakash S</RefAuthor>
        <RefAuthor>Bihari S</RefAuthor>
        <RefAuthor>Need P</RefAuthor>
        <RefAuthor>Sprick C</RefAuthor>
        <RefAuthor>Schuwirth L</RefAuthor>
        <RefTitle>Immersive high fidelity simulation of critically ill patients to study cognitive errors: a pilot study</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>36</RefPage>
        <RefTotal>Prakash S, Bihari S, Need P, Sprick C, Schuwirth L. Immersive high fidelity simulation of critically ill patients to study cognitive errors: a pilot study. BMC Med Educ. 2017;17(1):36. DOI: 10.1186&#47;s12909-017-0871-x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-017-0871-x</RefLink>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>De Beer M</RefAuthor>
        <RefAuthor>M&#229;rtensson L</RefAuthor>
        <RefTitle>Feedback on students&#39; clinical reasoning skills during fieldwork education</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>Aust Occup Ther J</RefJournal>
        <RefPage>255-264</RefPage>
        <RefTotal>De Beer M, M&#229;rtensson L. Feedback on students&#39; clinical reasoning skills during fieldwork education. Aust Occup Ther J. 2015;62(4):255-264. DOI: 10.1111&#47;1440-1630.12208</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;1440-1630.12208</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <Figure width="675" height="642" format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 1: Qualitative deductive content analysis with three levels of coding</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Qualitative deduktive Inhaltsanalyse mit drei Kodierungsebenen</Mark1></Pgraph></Caption>
        </Figure>
        <Figure width="887" height="458" format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 2: CR usage by question type and exam. Exam questions are categorized by semester (WS or SS) and number of the KFQ case study and follow-up question</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 2: Verwendung von CR nach Fragetyp und Pr&#252;fung. Die Pr&#252;fungsfragen sind nach Semester (WS oder SS) sowie nach Nummer der KFQ-Fallstudie und der Folgefrage kategorisiert</Mark1></Pgraph></Caption>
        </Figure>
        <Figure width="922" height="511" format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="en">3en</MediaID>
          <MediaID language="de">3de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 3: FR (Forward Reasoning) and BR (Backward Reasoning) usage compared between the three question types (factual, procedural, diagnostic) in summer- and winter semester (WS or SS) and number of the KFQ case study and  follow-up question</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 3: Vergleich der Anwendung von FR (Vorw&#228;rtsschlussfolgerung) und BR (R&#252;ckw&#228;rtsschlussfolgerung) bei den drei Fragetypen (sachbezogene, prozedurale und diagnostische Fragen) im Sommer- und Wintersemester (WS bzw. SS) sowie Nummer der KFQ-Fallstudie und der Folgefrage</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>3</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>