<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma001334</Identifier>
    <IdentifierDoi>10.3205/zma001334</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0013341</IdentifierUrn>
    <ArticleType language="en">article</ArticleType>
    <ArticleType language="de">Artikel</ArticleType>
    <TitleGroup>
      <Title language="en">Comparison of the evaluation of formative assessment at two medical faculties with different conditions of undergraduate training, assessment and feedback</Title>
      <TitleTranslated language="de">Vergleich der Bewertung einer formativen Pr&#252;fung an zwei medizinischen Fakult&#228;ten mit unterschiedlichen Studien-, Pr&#252;fungs- und Feedbackbedingungen</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Sch&#252;ttpelz-Brauns</Lastname>
          <LastnameHeading>Sch&#252;ttpelz-Brauns</LastnameHeading>
          <Firstname>Katrin</Firstname>
          <Initials>K</Initials>
          <AcademicTitle>Dr. rer. nat.</AcademicTitle>
        </PersonNames>
        <Address language="en">Medical Faculty Mannheim at Heidelberg University, Department of Undergraduate Education and Educational Development, Theodor-Kutzer-Ufer 1-3, D-68167 Mannheim, Germany, phone: &#43;49 (0)621&#47;383-71270, fax: &#43;49 (0)621&#47;383-71201<Affiliation>Medical Faculty Mannheim at Heidelberg University, Mannheim, Germany</Affiliation></Address>
        <Address language="de">Medizinische Fakult&#228;t Mannheim der Universit&#228;t Heidelberg, GB f&#252;r Studium und Lehrentwicklung, Theodor-Kutzer-Ufer 1-3, 68167 Mannheim, Deutschland, Tel.: &#43;49 (0)621&#47;383-71270, Fax: &#43;49 (0)621&#47;383-71201<Affiliation>Medizinische Fakult&#228;t Mannheim der Universit&#228;t Heidelberg, Mannheim, Deutschland</Affiliation></Address>
        <Email>katrin.schuettpelz-brauns&#64;medma.uni-heidelberg.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Karay</Lastname>
          <LastnameHeading>Karay</LastnameHeading>
          <Firstname>Yassin</Firstname>
          <Initials>Y</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University of Cologne, Medical Faculty, Cologne, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t zu K&#246;ln, Medizinische Fakult&#228;t, K&#246;ln, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Arias</Lastname>
          <LastnameHeading>Arias</LastnameHeading>
          <Firstname>Johann</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>RWTH Aachen University, Medical Faculty, Aachen, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>RWTH Aachen, Medizinische Fakult&#228;t, Aachen, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Gehlhar</Lastname>
          <LastnameHeading>Gehlhar</LastnameHeading>
          <Firstname>Kirsten</Firstname>
          <Initials>K</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Carl von Ossietzky University, School of Medicine and Health Sciences, Oldenburg, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Carl von Ossietzky Universit&#228;t Oldenburg, Fakult&#228;t f&#252;r Medizin und Gesundheitswissenschaften, Oldenburg, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Zupanic</Lastname>
          <LastnameHeading>Zupanic</LastnameHeading>
          <Firstname>Michaela</Firstname>
          <Initials>M</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Witten&#47;Herdecke, Faculty of Health, Witten, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Private Universit&#228;t Witten&#47;Herdecke gGmbH, Fakult&#228;t f&#252;r Gesundheit, Witten, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">formative assessment</Keyword>
      <Keyword language="en">medical education</Keyword>
      <Keyword language="en">progress test</Keyword>
      <Keyword language="en">test effort</Keyword>
      <Keyword language="de">Formative Pr&#252;fungen</Keyword>
      <Keyword language="de">Medizinische Ausbildung</Keyword>
      <Keyword language="de">Progress Testing</Keyword>
      <Keyword language="de">Testbem&#252;hen</Keyword>
      <SectionHeading language="en">Formative Assessment</SectionHeading>
      <SectionHeading language="de">Formatives Pr&#252;fen</SectionHeading>
    </SubjectGroup>
    <DateReceived>20190829</DateReceived>
    <DateRevised>20200310</DateRevised>
    <DateAccepted>20200427</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20200615</DatePublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>2366-5017</ISSN>
        <Volume>37</Volume>
        <Issue>4</Issue>
        <JournalTitle>GMS Journal for Medical Education</JournalTitle>
        <JournalTitleAbbr>GMS J Med Educ</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>41</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Einf&#252;hrung: </Mark1>Sowohl formative als auch summative Pr&#252;fungen haben ihre Berechtigung in medizinischen Curricula: formative Pr&#252;fungen zur Begleitung des Lernprozesses und summative Pr&#252;fungen zur Sicherung des Erreichens von Mindeststandards. Je nach Studien-, Pr&#252;fungs- und Feedbackbedingungen wird formativen Pr&#252;fungen durch die Studierenden mehr oder weniger Bedeutung beigemessen und entsprechend kann die Erf&#252;llung ihrer Funktion fraglich sein. In dieser Studie wird beschrieben, wie der nicht-bestehensrelevante formative Progress Test Medizin (PTM) an zwei Medizinischen Fakult&#228;ten mit partiell unterschiedlichen Rahmenbedingungen eingebettet ist und welche Auswirkungen diese auf das Testbem&#252;hen der Studierenden und die Bewertung des Tests, insbesondere der Wahrnehmung von dessen Nutzen und (immateriellen) Kosten, wie Nicht-Teilnahme an zeitgleichen Angeboten oder emotionale Beeintr&#228;chtigungen, haben. </Pgraph><Pgraph><Mark1>Methoden: </Mark1>In dieser Studie wurde der Anteil der nicht ernsthaften PTM-Teilnehmenden an zwei Medizinischen Fakult&#228;ten (Gesamtstichproben: N<Subscript>F1</Subscript>&#61;1.410, N<Subscript>F2</Subscript>&#61;1.176) im WS 15&#47;16 sowohl durch die Zahl nicht beantworteter Fragen im Test selbst als auch im Rahmen einer Befragung mit einem standardisierten Instrument (N<Subscript>F1</Subscript>&#61;415, N<Subscript>F2</Subscript>&#61;234) bestimmt. Weiterhin wurden in dieser Befragung offene Fragen zum wahrgenommenen Nutzen bzw. den wahrgenommenen Kosten gestellt, welche mit qualitativen und quantitativen Methoden ausgewertet wurden. </Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Der PTM wird an Fakult&#228;t 2 insgesamt besser angenommen. Dies zeigt sich in dem h&#246;heren Anteil ernsthafter Testteilnehmenden, den niedrigeren wahrgenommenen Kosten und dem h&#246;heren berichteten Nutzen sowie dem gr&#246;&#223;eren Anteil an konstruktiven Kommentaren. Studierende der Fakult&#228;t 2 haben das Prinzip des formativen Pr&#252;fens besser verstanden und nutzen die Ergebnisse des PTM als Feedback &#252;ber den eigenen Wissensfortschritt, zur Lernmotivation und zur Reduktion von Pr&#252;fungsangst.</Pgraph><Pgraph><Mark1>Diskussion: </Mark1>Wenn Medizinische Fakult&#228;ten formative Pr&#252;fungen in das Curriculum integrieren, m&#252;ssen sie Rahmenbedingungen schaffen, in denen diese Pr&#252;fungen als wichtiger Teil des Curriculums wahrgenommen werden. Ansonsten ist es fraglich, ob sie ihrer Funktion der Begleitung des Lernprozesses gerecht werden k&#246;nnen. </Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Introduction: </Mark1>Both formative and summative assessments have their place in medical curricula: formative assessment to accompany the learning process and summative assessment to ensure that minimum standards are achieved. Depending on the conditions of undergraduate training, assessment and feedback, students place more or less importance on formative assessment, and thus the fulfilment of its function may be questionable. This study describes how the low-stakes formative Berlin Progress Test (BPT) is embedded at two medical faculties with partially different framework conditions and what effects these have on the students&#39; testing efforts and the evaluation of the test, especially the perception of its benefits and (intangible) costs, such as non-participation in contemporaneous activities and emotional impairments. </Pgraph><Pgraph><Mark1>Methods: </Mark1>In this study, the proportion of non-serious BPT participants at two medical faculties (total sample: N<Subscript>F1</Subscript>&#61;1,410, N<Subscript>F2</Subscript>&#61;1,176) in winter term 2015&#47;16 was determined both by the number of unanswered questions on the test itself and in a survey using a standardized instrument (N<Subscript>F1</Subscript>&#61;415, N<Subscript>F2</Subscript>&#61;234). Furthermore, open questions were asked in this survey about perceived benefits and perceived costs, which were analyzed with qualitative and quantitative methods. </Pgraph><Pgraph><Mark1>Results: </Mark1>The BPT is generally better accepted at Faculty 2. This can be seen in the higher proportion of serious test takers, the lower perceived costs and the higher reported benefit, as well as the higher proportion of constructive comments. Faculty 2 students better understood the principle of formative testing and used the results of the BPT as feedback on their own knowledge progress, motivation to learn and reduction of exam fear.</Pgraph><Pgraph><Mark1>Discussion:</Mark1> When medical faculties integrate formative assessments into the curriculum, they have to provide a framework in which these assessments are perceived as an important part of the curriculum. Otherwise, it is questionable whether they can fulfil their function of accompanying the learning process.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="Introduction">
      <MainHeadline>Introduction</MainHeadline><Pgraph>According to the Medical Licensing Regulations (&#196;AppO), &#167;2 subsection 7, successful participation in the pre-clinical phase must be proven with 17 major course assessments (Appendix 2a) and in the clinical phase with 40 major course assessments (Appendix 2b). This proof is either provided by a graded assessment, which tests the learning outcome of a section, such as a subject or module, or by a pass&#47;fail assessment. Therefore, these are assessments of learning or summative assessment <TextLink reference="1"></TextLink>. On the other hand, there are assessments that accompany the learning process. These formative assessments &#91;1&#93; promote continuous and in-depth learning <TextLink reference="2"></TextLink>. Feedback is a central aspect of continuous learning in that gaps in learning are identified and corrected in a targeted manner. Continuous learning prepares for lifelong learning, which is becoming increasingly important due to the fast pace of knowledge and constantly changing requirements <TextLink reference="3"></TextLink>. There are already some studies on formative assessment that investigate the effect on learning. This so-called educational impact is part of the model of utility of assessment methods <TextLink reference="4"></TextLink> and can be seen as an indication that the effect on continuous learning is given by the formative assessment or its feedback. Wade et al. developed a questionnaire to compare the perception of progress tests &#8211; a type of formative assessment (see below) &#8211; as a learning tool at two different medical schools and found that the learning environment has an impact on the appreciation of progress tests as a learning support <TextLink reference="5"></TextLink>. Cobb et al. asked students in semi-qualitative interviews about their perception of DOPS (formative direct observation of procedural skills) compared to MCQs (summative multiple-choice assessment) and found that formative testing promoted deeper learning, but summative testing was more important for students <TextLink reference="6"></TextLink>. In a questionnaire study at the Faculty of Health Sciences in Maastricht, students found summative block tests more rewarding and did not use the results of the progress test for self-regulated learning <TextLink reference="7"></TextLink>. Embedding feedback through&#47;with progress tests in a comprehensive examination programme increased student use of the progress test feedback tool and integration into learning <TextLink reference="8"></TextLink> .  </Pgraph><Pgraph>Both the continuous accompaniment of the learning process through formative assessment and the assurance of the achievement of minimum standards in the form of summative assessment are justified in the medical curriculum. </Pgraph><Pgraph>It can be assumed that the two aims &#8211; learning for the assessment vs. assessment for learning &#8211; are pursued by students with varying degrees of intensity, which can be seen in the different extent of test effort. This can be explained with the Expectancy Value Theory of Wigfield &#38; Eccles <TextLink reference="9"></TextLink>. The Expectancy Value Theory states that the motivation to complete a task depends on two components: the expectation of being able to solve a task and the value that this task has for the individual. Wigfield &#38; Eccles <TextLink reference="9"></TextLink> distinguish four different components that can make up this value:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Performance value (to master the task in the best possible way),</ListItem><ListItem level="1">Intrinsic value (the fun or joy in solving the task),</ListItem><ListItem level="1">Utility value (how well the task fits into future plans, i.e. how useful the task is)</ListItem><ListItem level="1">Costs (costs in the strict sense, the extent to which activities compete with each other, but also emotional costs).</ListItem></UnorderedList></Pgraph><Pgraph>With regard to summative and formative assessment, there is a difference in the value given to a task, the assessment. The value that a task or assessment has for each student is also influenced by the general conditions at the medical school. This has a decisive influence on the perceived benefits and costs. For example, it is very likely that the summative assessments are in the focus of the students, if the evidence required by the &#196;AppO has to be proven at their medical faculty exclusively by summative assessment. In the worst case, they learn extremely efficiently, i.e. they learn all the required content shortly before the corresponding assessment, the so-called bulimia learning <TextLink reference="10"></TextLink>. From the students&#39; point of view, the benefit &#8211; passing the assessment &#8211; would be maximum at minimum cost. The knowledge acquired in this way runs the risk of being &#8220;ticked off&#8221; after the exam and soon forgotten <TextLink reference="11"></TextLink>.</Pgraph><Pgraph>Especially with regard to the benefits and costs of Expectancy Value Theory, faculties can provide framework conditions to increase the motivation to use formative assessment and thus the influence on learning. Formative assessment can be seen as an additional effort, especially if summative assessments and&#47;or work-intensive courses (study load) have to be taken in parallel. If, on the other hand, formative assessment is perceived as a meaningful and valuable component of the overall curriculum and is valued by faculty members, the benefit of formative assessment could be regarded as high &#8211; despite contemporaneously graded assessment and high study load. </Pgraph><Pgraph>The formative progress tests in medicine offer an opportunity to investigate under which conditions formative assessment can be successfully implemented despite the competing summative assessments that are perceived as more useful. </Pgraph><Pgraph>Progress tests are multiple-choice tests that regularly test students&#8217; medical knowledge during undergraduate training at the level of a new graduate and compare it with the knowledge level of fellow students in the same semester in order to identify gaps in the current level of knowledge and to constructively influence learning behaviour. All types of progress tests provide feedback, but are used differently with regard to their stakes. In the Dutch consortium and in the USA, for example, the results of the progress test are accumulated over several test times for each individual <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. This means that the progress tests are not graded, but they do have an influence on the progress of study. In Germany and Austria, participation is mandatory, but is not graded (low stakes) <TextLink reference="2"></TextLink>, <TextLink reference="14"></TextLink>. In the German-speaking Progress Test Medicine (BPT) consortium, test preparation and analyses are carried out centrally at the Charit&#233; University Medicine in Berlin. All test takers receive detailed feedback from Berlin about 4-6 weeks after the test on their results over the years, but also in comparison with their fellow students, differentiated by organ systems and subjects. The varying degree of test efforts at the individual faculties is reflected in the proportion of serious test takers, which is routinely computed after each test. In the case of the low-stakes BPT, it is shown that there are very different proportions of serious test takers at the various faculties. Proportions of 75-90&#37; were reported by the participating faculties <TextLink reference="15"></TextLink>.</Pgraph><Pgraph>This study examines how the low-stakes BPT is embedded in two faculties and how this affects the students&#8217; testing efforts and the perception of the progress test, especially the perception of costs and benefits as a formative test. The framework conditions for the BPT differ at both faculties, among other things, in their integration into each curriculum: The conditions of undergraduate training, assessment and feedback are shown in detail in table 1 <ImgLink imgNo="1" imgType="table"/>. </Pgraph><Pgraph>Looking at the conditions of assessment and feedback at both faculties, the proportion of serious test takers and the associated perception of the costs and benefits of the BPT should be comparable, as both faculties have conditions that should have a positive effect on motivation and, accordingly, on testing efforts. </Pgraph><Pgraph>Students at Faculty 1 have a choice that is not available at Faculty 2. They can choose which 8 out of 10 BPTs they would like to take. According to the Self-Determination Theory of Ryan &#38; Deci <TextLink reference="16"></TextLink>, this should increase intrinsic motivation and thus increase the proportion of serious test takers. </Pgraph><Pgraph>In addition, Faculty 1 provides immediate feedback from the computer-based administration. Immediate feedback is important for completing tasks and being satisfied with the work <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="19"></TextLink>. Therefore, the condition of computer-based administration should also increase the test effort and thus the proportion of serious test takers. </Pgraph><Pgraph>Although the feedback is immediate, there is no dialogue about the results at Faculty 1. The dialogue about the results is integrated into the mentoring programme at Faculty 2. Dialogue is essential for effective feedback and thus for the functioning of formative assessment <TextLink reference="20"></TextLink>, <TextLink reference="21"></TextLink>, <TextLink reference="22"></TextLink>. This should increase the<Mark2> perceived benefit</Mark2> of the BPT at Faculty 2.</Pgraph><Pgraph>Since the BPT is communicated as an assessment at Faculty 2, as opposed to Faculty 1, where it is presented as an evaluation, the BPT at Faculty 2 should be perceived as more useful for another reason. As Heeneman et al. were able to show in their study, students use the feedback system of the moderate-stakes progress test more and have higher test scores when the progress test is integrated into a holistic examination system <TextLink reference="8"></TextLink>. The higher test scores were seen as an indirect indicator of test efforts. At the same time, the <Mark2>perceived costs</Mark2> are lower when the formative test is part of the assessment system. </Pgraph><Pgraph>Taking into account the conditions at the two faculties and their theoretical influences on the test effort, measured by the proportion of serious vs. non-serious test takers, and on the perceived costs and benefits of the BPT, the following hypotheses can be derived: </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1."><Mark2>The proportion of non-serious test takers at Faculty 1 (F1) is lower than at Faculty 2 (F2).</Mark2></ListItem><ListItem level="1" levelPosition="2" numString="2."><Mark2>The perceived costs of the BPT are higher at Faculty 1 (F1) than at Faculty 2 (F2).</Mark2></ListItem><ListItem level="1" levelPosition="3" numString="3."><Mark2>The perceived benefit of the BPT is lower at Faculty 1 (F1) than at Faculty 2 (F2). </Mark2></ListItem></OrderedList></Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Nach der &#196;rztlichen Approbationsordnung (&#196;AppO) &#167;2 Absatz 7 Satz 1 muss die erfolgreiche Teilnahme im vorklinischen Abschnitt mit 17 Leistungsnachweisen (Anlage 2a) und im klinischen Abschnitt mit 40 Leistungsnachweisen (Anlage 2b) nachgewiesen werden. Dieser Nachweis erfolgt entweder mit benoteten Pr&#252;fungen, welche das Lernergebnis eines Abschnittes, wie ein Fach oder ein Modul abpr&#252;fen oder mit der Bewertung bestanden&#47;nicht bestanden. Daher handelt es sich hierbei um das Pr&#252;fen des Lernens bzw. summative Pr&#252;fungen <TextLink reference="1"></TextLink>. Demgegen&#252;ber stehen Pr&#252;fungen, welche den Lernprozess begleiten. Diese formativen Pr&#252;fungen <TextLink reference="1"></TextLink>  f&#246;rdern das kontinuierliche und vertiefende Lernen <TextLink reference="2"></TextLink>. Feedback ist ein zentraler Aspekt des kontinuierlichen Lernens, indem L&#252;cken im Lernen identifiziert und gezielt korrigiert werden. Das kontinuierliche Lernen bereitet auf das lebenslange Lernen vor, welches aufgrund der Schnelllebigkeit von Wissen und dem st&#228;ndigen Wechsel von Anforderungen immer mehr verlangt wird <TextLink reference="3"></TextLink>. Es gibt bereits einige Studien zu formativen Pr&#252;fungen, welche die Wirkung auf das Lernen untersuchen. Dieser sog. Educational Impact ist Teil des N&#252;tzlichkeitsmodells f&#252;r Pr&#252;fungen <TextLink reference="4"></TextLink> und kann als Indiz daf&#252;r gesehen werden, dass die Wirkung auf das kontinuierliche Lernen durch die formative Pr&#252;fung bzw. deren Feedback gegeben ist. Wade et al. entwickelten einen Fragebogen, um die Wahrnehmung von Progress Tests &#8211; einer Art der formativen Pr&#252;fungen (s. u.) &#8211; als Lernwerkzeug an zwei verschiedenen medizinischen Fakult&#228;ten zu vergleichen und fanden, dass die Lernumgebung einen Einfluss auf die Wertsch&#228;tzung von Progress Tests als Unterst&#252;tzung des Lernens hat <TextLink reference="5"></TextLink>. Cobb et al. befragten Studierende in semi-qualitativen Interviews zu ihrer Wahrnehmung von DOPS (formativen Direct Observation of Procedural Skills) im Vergleich zu MCQ (summativen Multiple-Choice-Pr&#252;fungen) und fanden, dass die formative Pr&#252;fung tieferes Lernen f&#246;rderte, aber die summative Pr&#252;fung f&#252;r die Studierenden wichtiger war <TextLink reference="6"></TextLink>. In einer Fragebogenstudie an der Fakult&#228;t f&#252;r Gesundheitswissenschaften in Maastricht wurden summative Blocktests von den Studierenden als lohnender empfunden und die Ergebnisse des Progress Tests nicht f&#252;r selbstreguliertes Lernen verwendet <TextLink reference="7"></TextLink>. Die Einbettung von Feedback durch&#47;mit Progress Tests in ein umfassendes Pr&#252;fungsprogramm erh&#246;hte die Verwendung des Progress-Test-Feedbacktools durch die Studierenden und die Integration in das Lernen <TextLink reference="8"></TextLink>.  </Pgraph><Pgraph>Sowohl das kontinuierliche Begleiten des Lernprozesses durch formative Pr&#252;fungen als auch das Sicherstellen des Erreichens von Mindeststandards in Form von summativen Pr&#252;fungen haben ihre Berechtigung im medizinischen Curriculum. </Pgraph><Pgraph>Es ist anzunehmen, dass die beiden Zielrichtungen des Lernens &#8211; Lernen f&#252;r die Pr&#252;fung vs. Pr&#252;fungen f&#252;r das Lernen &#8211; von Seiten der Studierenden unterschiedlich intensiv verfolgt werden, welches sich in dem unterschiedlichen Ausma&#223; an Testbem&#252;hen zeigt. Dies l&#228;sst sich mit der Erwartungs-Wert-Theorie von Wigfield &#38; Eccles <TextLink reference="9"></TextLink> erkl&#228;ren. Die Erwartungs-Wert-Theorie besagt, dass die Motivation zur Erledigung einer Aufgabe von zwei Komponenten abh&#228;ngig ist: die Erwartung, eine Aufgabe l&#246;sen zu k&#246;nnen und dem Wert, den diese Aufgabe f&#252;r das Individuum hat. Wigfield &#38; Eccles <TextLink reference="9"></TextLink> unterscheiden vier verschiedene Komponenten, die diesen Wert ausmachen k&#246;nnen:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Leistungswert (die Aufgabe bestm&#246;glich zu meistern),</ListItem><ListItem level="1">Intrinsischer Wert (der Spa&#223; bzw. die Freude beim L&#246;sen der Aufgabe),</ListItem><ListItem level="1">Nutzenwert (wie gut die Aufgabe in zuk&#252;nftige Pl&#228;ne passt, also wie n&#252;tzlich die Aufgabe ist),</ListItem><ListItem level="1">Kosten (Kosten im eigentlichen Sinne, inwiefern Aktivit&#228;ten miteinander konkurrieren, aber auch emotionale Kosten).</ListItem></UnorderedList></Pgraph><Pgraph>In Bezug auf summative und formative Pr&#252;fungen gibt es einen Unterschied bei dem Wert, der einer Aufgabe, der Pr&#252;fung, beigemessen wird. Welchen Wert eine Aufgabe bzw. Pr&#252;fung f&#252;r jede&#47;n Einzelne&#47;n hat, wird auch durch die Rahmenbedingungen an der eigenen Fakult&#228;t beeinflusst. Diese hat ma&#223;geblichen Einfluss auf den wahrgenommenen Nutzen und die wahrgenommenen Kosten. Zum Beispiel ist es sehr wahrscheinlich, dass die summativen Pr&#252;fungen im Fokus der Studierenden stehen, wenn an der eigenen medizinischen Fakult&#228;t die nach &#196;AppO vorgeschriebenen Nachweise ausschlie&#223;lich durch summative Pr&#252;fungen nachgewiesen werden m&#252;ssen. Im ung&#252;nstigsten Fall lernen sie &#228;u&#223;erst effizient, d. h. alle jeweils geforderten Inhalte kurz vor der entsprechenden Pr&#252;fung, das sog. Bulimielernen <TextLink reference="10"></TextLink>. Damit w&#228;re aus Sicht der Studierenden der Nutzen - Bestehen der Pr&#252;fungen - maximal bei minimalen Kosten. Dieses so erworbene Wissen l&#228;uft Gefahr nach der Pr&#252;fung &#8222;abgehakt&#8220; und bald vergessen zu werden <TextLink reference="11"></TextLink>.</Pgraph><Pgraph>Gerade was Nutzen und Kosten aus der Erwartungs-Wert-Theorie betrifft, k&#246;nnen Fakult&#228;ten Rahmenbedingungen schaffen, um die Motivation zur Nutzung von formativen Pr&#252;fungen und damit den Einfluss auf das Lernen zu erh&#246;hen. So k&#246;nnen formative Pr&#252;fungen als zus&#228;tzlicher Aufwand gesehen werden, v. a. wenn summative Pr&#252;fungen und&#47;oder arbeitsintensive Lehrveranstaltungen (study load) parallel absolviert werden m&#252;ssen. Wenn dagegen die formative Pr&#252;fung als sinnvoller und wertvoller Bestandteil des Gesamtcurriculums wahrgenommen wird und von den Fakult&#228;tsangeh&#246;rigen wertgesch&#228;tzt wird, k&#246;nnte der Nutzen der formativen Pr&#252;fung &#8211; trotz paralleler benoteter Pr&#252;fungen und hoher study load &#8211; als hoch angesehen werden. </Pgraph><Pgraph>Eine M&#246;glichkeit zu untersuchen, unter welchen Bedingungen formative Pr&#252;fungen &#8211; trotz konkurrierender und damit als n&#252;tzlicher wahrgenommene &#8211; summativer Pr&#252;fungen erfolgreich implementiert werden k&#246;nnen, bietet der formative Progress Tests Medizin. </Pgraph><Pgraph>Progress Tests sind Multiple-Choice-Tests, die das medizinische Wissen einer Berufsanf&#228;ngerin&#47;eines Berufsanf&#228;ngers regelm&#228;&#223;ig im Verlauf des Studiums erfassen und mit dem Wissensstand der Kommiliton&#47;innen des gleichen Semesters vergleichen, um L&#252;cken im aktuellen Wissensstand zu identifizieren und um das Lernverhalten konstruktiv zu beeinflussen. Alle Arten von Progress Tests geben Feedback, werden jedoch unterschiedlich bzgl. ihrer Bestehensrelevanz verwendet. Im niederl&#228;ndischen Konsortium und in den U.S.A. werden z. B. die Ergebnisse des Progress Tests pro Individuum &#252;ber mehrere Testzeitpunkte akkumuliert und sind in dieser Form bestehensrelevant <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. Das hei&#223;t, die Progress Tests werden zwar nicht benotet, haben aber dennoch einen Einfluss auf den Fortgang im Studium. In Deutschland und &#214;sterreich sind die Teilnahmen zwar verpflichtend, jedoch nicht bestehensrelevant <TextLink reference="2"></TextLink>, <TextLink reference="14"></TextLink>. Im deutschsprachigen Konsortium Progress Test Medizin (PTM) erfolgt die Testerstellung und Auswertung zentral an der Charit&#233;-Universit&#228;tsmedizin in Berlin. Alle Teilnehmenden des Tests erhalten aus Berlin ca. 4-6 Wochen nach dem Test eine ausf&#252;hrliche R&#252;ckmeldung ihrer Ergebnisse im Verlauf der Jahre, aber auch im Vergleich mit ihren Kommiliton&#47;innen, differenziert nach Organsystemen und F&#228;chern. Das unterschiedliche Ausma&#223; an Testbem&#252;hen an den einzelnen Fakult&#228;ten zeigt sich im Anteil ernsthafter Testteilnehmender, der routinem&#228;&#223;ig nach jeder Testdurchf&#252;hrung ermittelt wird. Beim nicht bestehensrelevanten PTM zeigt sich, dass es sehr unterschiedliche Anteile an ernsthaften Testteilnehmenden an den verschiedenen Fakult&#228;ten gibt. So wurden Anteile von 75-90&#37; an den teilnehmenden Fakult&#228;ten berichtet <TextLink reference="15"></TextLink>.</Pgraph><Pgraph>In der vorliegenden Studie wird untersucht, wie der nicht-bestehensrelevante PTM an zwei Medizinischen Fakult&#228;ten eingebettet ist und welchen Einfluss das auf das Testbem&#252;hen der Studierenden und die Wahrnehmung des Progress Tests, spezieller die Wahrnehmung der Kosten sowie des Nutzens, als formative Pr&#252;fung hat. Die Rahmenbedingungen f&#252;r den PTM unterscheiden sich in beiden Fakult&#228;ten unter anderem in der Einbindung in das jeweilige Curriculum: Die Studien-, Pr&#252;fungs- und Feedbackbedingungen im Vergleich sind in Tabelle 1 <ImgLink imgNo="1" imgType="table"/> detailliert dargestellt. </Pgraph><Pgraph>Wenn man die Pr&#252;fungs- und Feedbackbedingungen an beiden Fakult&#228;ten betrachtet, sollte der Anteil ernsthafter Testteilnehmender und die damit einhergehende Wahrnehmung der Kosten und des Nutzens des PTM vergleichbar sein, da beide Fakult&#228;ten Bedingungen aufweisen, welche positiv auf die Motivation und entsprechend auf das Testbem&#252;hen wirken sollten. </Pgraph><Pgraph>So haben die Studierenden an der Fakult&#228;t 1 eine Wahlm&#246;glichkeit, die an Fakult&#228;t 2 nicht vorhanden ist. Sie k&#246;nnen w&#228;hlen, an welchen 8 von 10 PTM sie teilnehmen m&#246;chten. Nach der Selbstbestimmungstheorie von Ryan &#38; Deci <TextLink reference="16"></TextLink> sollte dies die intrinsische Motivation erh&#246;hen und sich damit auch der <Mark2>Anteil ernsthafter Testteilnehmender</Mark2> erh&#246;hen. </Pgraph><Pgraph>Au&#223;erdem gibt es an der Fakult&#228;t 1 ein sofortiges Feedback durch die computer-basierte Administration. Sofortiges Feedback ist wichtig, damit man Aufgaben beendet und mit der Arbeit zufrieden ist <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="19"></TextLink>. Daher sollte sich auch durch die Bedingung der computer-basierten Administration das Testbem&#252;hen erh&#246;hen und damit auch der Anteil ernsthafter Testteilnehmender. </Pgraph><Pgraph>Obwohl die R&#252;ckmeldung der Ergebnisse sehr schnell erfolgt, gibt es keinen Dialog &#252;ber die Ergebnisse an Fakult&#228;t 1. Der Dialog &#252;ber die Ergebnisse ist an der Fakult&#228;t 2 in das Mentorenprogramm eingebunden. Der Dialog ist essentiell f&#252;r ein effektives Feedback und damit f&#252;r das Funktionieren formativer Pr&#252;fungen <TextLink reference="20"></TextLink>, <TextLink reference="21"></TextLink>, <TextLink reference="22"></TextLink>. Die sollte den <Mark2>wahrgenommenen Nutzen</Mark2> des PTM an Fakult&#228;t 2 erh&#246;hen.</Pgraph><Pgraph>Da an Fakult&#228;t 2 der PTM als Pr&#252;fung kommuniziert wird, im Gegensatz zu Fakult&#228;t 1, in der er als Evaluation pr&#228;sentiert wird, sollte der PTM an Fakult&#228;t 2 aus einem weiteren Grund als n&#252;tzlicher wahrgenommen werden. Wie Heeneman et al. in ihrer Studie zeigen konnten, nutzen Studierende das Feedbacksystem des bestehensrelevanten Progress Tests mehr und haben h&#246;here Testwerte, wenn der Progress Test in ein ganzheitliches Pr&#252;fungssystem eingebunden ist <TextLink reference="8"></TextLink>. Die h&#246;heren Testwerte wurden dabei als indirekter Indikator f&#252;r Testbem&#252;hen angesehen. Gleichzeitig werden die <Mark2>wahrgenommenen Kosten</Mark2> niedriger, wenn die formative Pr&#252;fung Teil des Pr&#252;fungssystems ist. </Pgraph><Pgraph>Unter Ber&#252;cksichtigung der Bedingungen an den beiden Fakult&#228;ten und deren theoretischen Einfl&#252;sse auf das Testbem&#252;hen, gemessen am Anteil ernsthafter vs. nicht ernsthafter Testteilnehmender, sowie auf die wahrgenommenen Kosten und Nutzen des PTM, lassen sich folgende Hypothesen ableiten: </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1."><Mark2>Der Anteil nicht ernsthafter Testteilnehmender an Fakult&#228;t 1 (F1) ist niedriger als an Fakult&#228;t 2 (F2). </Mark2></ListItem><ListItem level="1" levelPosition="2" numString="2."><Mark2>Die wahrgenommenen Kosten des PTM sind an Fakult&#228;t 1 (F1) h&#246;her als an Fakult&#228;t 2 (F2).</Mark2></ListItem><ListItem level="1" levelPosition="3" numString="3."><Mark2>Der wahrgenommene Nutzen des PTM ist an Fakult&#228;t 1 (F1) niedriger als an Fakult&#228;t 2 (F2). </Mark2></ListItem></OrderedList></Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Methods">
      <MainHeadline>Methods</MainHeadline><Pgraph>The study is conducted as a mixed-method approach, in which the proportions of non-serious test takers are determined quantitatively. In the qualitative part, the themes are identified which are relevant for the students in terms of perceived benefits and costs in relation to the BPT at both faculties. </Pgraph><SubHeadline2>Sample </SubHeadline2><Pgraph>In winter semester 2015&#47;16, N&#61;1,410 (F1) and N&#61;1,176 (F2) medical students participated in the BPT. This corresponds to 50&#37; of the enrolled medical students at F1 and 61&#37; at F2. The proportion of female students at the faculties is 62&#37; (F1) and 68&#37; (F2).</Pgraph><SubHeadline2>Material </SubHeadline2><Pgraph>The proportion of non-serious test takers was determined in two different ways. On the one hand, those students who chose the &#8220;don&#39;t know&#8221; option for all questions or skipped all questions when filling out the test in winter term 2015&#47;16 were identified as non-serious, since even in the first semester at least two questions can be answered. On the other hand, the test effort was determined by means of the Test-Effort Short Scale (TESS) <TextLink reference="23"></TextLink>. TESS consists of three five-stage Likert items with the gradations 1 to 5, which ask for the performance value (&#8220;I would like to achieve the best possible result on the BPT&#8221;), the utility value (&#8220;I find the BPT useful&#8221;) and the perceived costs (&#8220;The BPT is a valuable part of my undergraduate training&#8221;). The mean value is calculated from the answers to all three questions. Students who did not agree with these statements and answered all questions with 1 (corresponding to a TESS score of 1) are categorized as non-serious test takers. Both procedures each have a methodological disadvantage that could reduce their validity. The disadvantage of self-response tests is that there is an unknown percentage of students who answer in a socially desirable manner. This means that they could indicate a higher level of testing effort than is actually the case. The disadvantage of identification via the &#8220;don&#39;t know&#8221; option is that there may also be so-called pattern markers. These are test takers who answer all questions but do so without knowing the text of the questions <TextLink reference="24"></TextLink>. Due to these disadvantages, both methods have been used in parallel. </Pgraph><Pgraph>In order to make the perceived costs and benefits measurable, we have asked open questions. Both the concept of costs and the concept of benefits are very abstract. Therefore, we asked formally balanced questions that provoke possible answers that can be assigned to these two terms. These are, on the one hand, questions about the disadvantages and advantages of the BPT, but also questions directly about the benefits of the BPT. Students who use the BPT should also talk to other people about their results, such as their mentor, in order to change their own learning behaviour. </Pgraph><Pgraph>The perceived costs were addressed in two open questions: </Pgraph><Pgraph><UnorderedList><ListItem level="1">Do you feel emotionally impaired by the BPT&#63; (Question 1)</ListItem><ListItem level="1">What disadvantages do you see in the BPT&#63; (Question 2)</ListItem></UnorderedList></Pgraph><Pgraph>The perceived benefit was determined by means of five questions (two closed and three open questions) on different aspects: </Pgraph><Pgraph><UnorderedList><ListItem level="1">Dialogue with other people about the results of the BPT with the sub-questions:</ListItem><UnorderedList><ListItem level="2">I talk with fellow students about my results on the BPT. (Likert item, with 1 &#8220;does not apply&#8221; to 5 &#8220;applies&#8221;);</ListItem></UnorderedList><UnorderedList><ListItem level="2">I talk to my mentor about my results on the BPT. (Likert item, with 1 &#8220;does not apply&#8221; to 5 &#8220;applies&#8221;);</ListItem></UnorderedList><UnorderedList><ListItem level="2">I talk to other people about my results on the BPT. With ... (open question, Question 3).</ListItem></UnorderedList><ListItem level="1">Do you use the results of the BPT for other purposes&#63; (open question, Question 4)</ListItem><ListItem level="1">What advantages do you see in the BPT&#63; (open question, Question 5)</ListItem></UnorderedList></Pgraph><Pgraph>There was no limit to the number of comments that students could make on the open questions. </Pgraph><Pgraph>In addition, the questionnaire asked for gender and semester of study in order to check the comparability of both groups. </Pgraph><SubHeadline2>Procedures</SubHeadline2><Pgraph>At Faculties 1 and 2, the BPT took place in the first weeks of the semester on the university premises and under supervision. At least two non-overlapping dates were planned for each cohort, which the students could choose independently. At both faculties the testing was computer-based. At Faculty 2, additional dates for paper-based testing were offered.</Pgraph><Pgraph>The students at both faculties participated regularly in the BPT. At the beginning of the test, students were informed about the overall study in addition to the regular introduction. The overall study examines the motivation on the BPT and its influence on learning on the BPT. Therefore, the questionnaire contained more questions than the ones given here. In the regular introduction, the participants were asked to complete the questionnaire after the test had been completed and were informed that this participation was voluntary and anonymous. The Ethical Review Board of the Medical Faculty Mannheim, Heidelberg University, approved the study (2015-542-N-MA).</Pgraph><SubHeadline2>Analyses</SubHeadline2><Pgraph>The proportion of non-serious test takers per faculty was checked for independence in each case using a &#967;<Superscript>2</Superscript> test. Since the sample is very large and therefore even small differences can become significant, the effect size was measured with Cohen&#8217;s w for contingency tables and Cohen&#8217;s d for metric data (see below) in order to assess the relevance of differences <TextLink reference="25"></TextLink>. The effect size w is categorized as no effect with w&#60;0.1, small effect with w&#60;0.3, moderate effect with w&#60;0.5 and large effect with w&#8805;0.5 <TextLink reference="25"></TextLink>. </Pgraph><Pgraph>To compare the TESS scores between the two faculties, a t-test for independent samples with unequal variances was calculated, and the effect size d according to Cohen <TextLink reference="25"></TextLink>, with pooled standard deviations according to Leonhart (2004) was calculated <TextLink reference="26"></TextLink>. The categorization of d is as follows: d&#60;0.2 no effect, d&#60;0.5 small effect, d&#60;0.8 moderate effect and d&#8805;0.8 large effect. </Pgraph><Pgraph>The analyses of the two Likert items (<Mark2>&#8220;I talk with fellow students&#8221;</Mark2> and <Mark2>&#8220;I talk with my mentor about my results on the BPT&#8221;</Mark2>) were recoded so that statements of 4 or 5 were considered as agreement. </Pgraph><Pgraph>Qualitative and quantitative methods were used to evaluate the open questions about the costs and benefits of the BPT. The data from the evaluation questionnaire were analysed in three steps: First, two authors (KG, MZ) examined all comments on the open questions and coded them independently of each other using the thematic content analysis <TextLink reference="27"></TextLink>. In a second step, after joint discussion of discrepancies and new perspectives, these codes were again independently grouped into categories and a category list was created. In the third step, this category list was checked for inter-coder reliability with perfect matches (100&#37; each) for the open questions 1 (8 categories), 3 (7 categories) and 4 (4 categories). Very good matches were found for the open questions 2 (94&#37;, 9 categories) and question 5 (97&#37;, 12 categories), so that this category list was used in the further analyses. The number of entries per category is given in the results section. The corresponding percentages refer to the total number of mentions for the given question. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Methodik">
      <MainHeadline>Methodik</MainHeadline><Pgraph>Die Studie erfolgt in einem Mixed-Method-Ansatz, bei dem quantitativ die Anteile der nicht ernsthaften Testteilnehmenden bestimmt werden. Im qualitativen Teil werden die Themen identifiziert, die f&#252;r die Studierenden bezogen auf den PTM in beiden Fakult&#228;ten bzgl. des wahrgenommenen Nutzen und der Kosten jeweils von Relevanz sind. </Pgraph><SubHeadline2>Stichprobe</SubHeadline2><Pgraph>Im Wintersemester 2015&#47;16 nahmen N&#61;1.410 (F1) bzw. N&#61;1.176 (F2) Medizinstudierende am PTM teil. Das entspricht einem Anteil von 50 &#37; der immatrikulierten Medizinstudierenden in F1 bzw. 61&#37; in F2. Der Frauenanteil der Studierenden an den beiden Fakult&#228;ten betr&#228;gt 62&#37; (F1) bzw. 68&#37; (F2).</Pgraph><SubHeadline2>Material </SubHeadline2><Pgraph>Der Anteil nicht ernsthafter Testteilnehmender wurde auf zwei verschiedene Wege ermittelt. Zum einen wurden die Studierenden, die beim Ausf&#252;llen des Tests im WiSe 2015&#47;16 bei allen Fragen die &#8222;wei&#223; nicht&#8220;-Option gew&#228;hlt oder alle Fragen &#252;bersprungen haben, als nicht ernsthaft identifiziert, da selbst im 1. Semester die eine oder andere Frage beantwortet werden kann. Zum anderen wurde das Testbem&#252;hen mit Hilfe der Test-Effort Short Scale (TESS) <TextLink reference="23"></TextLink> ermittelt. TESS besteht aus drei f&#252;nf-stufigen Likert-Items mit den Abstufungen 1 bis 5, die den Leistungswert (&#8222;Ich m&#246;chte beim PTM die bestm&#246;glichen Ergebnisse erreichen.&#8220;), den Nutzenwert (&#8222;Ich finde den PTM sinnvoll.&#8220;) und die wahrgenommenen Kosten (&#8222;Der PTM ist ein wertvoller Teil meines Studiums.&#8220;) erfragen. Aus den Antworten auf alle drei Fragen wird der Mittelwert berechnet. Studierende, die der jeweiligen Aussage nicht zustimmten und alle Fragen mit 1 beantworteten (entspricht einem TESS-Score von 1), werden als nicht ernsthafte Testteilnehmende kategorisiert. Beide Verfahren haben jeweils einen methodischen Nachteil, der die Validit&#228;t mindern k&#246;nnte. Der Nachteil bei der Selbstauskunft ist, dass es einen unbekannten Prozentsatz von Studierenden gibt, die sozial erw&#252;nscht antworten. Das bedeutet, dass sie ein h&#246;heres Ausma&#223; an Testbem&#252;hen angeben k&#246;nnten, als dies tats&#228;chlich der Fall ist. Der Nachteil bei der Identifikation &#252;ber die &#8222;wei&#223; nicht&#8220;-Option liegt darin, dass es auch sog. Musterkreuzer geben kann. Dies sind Testteilnehmende, welche zwar alle Fragen beantworten, dies jedoch ohne Kenntnis des Fragentextes tun <TextLink reference="24"></TextLink>. Aufgrund dieser Nachteile sind beide Verfahren parallel angewendet worden. </Pgraph><Pgraph>Um die wahrgenommenen Kosten und Nutzen messbar zu machen, haben wir offene Fragen gestellt. Sowohl der Begriff der Kosten als auch der Begriff des Nutzens sind sehr abstrakt. Daher haben wir formal balancierte Fragen gestellt, die Antwortm&#246;glichkeiten provozieren, die sich diesen beiden Begriffen zuordnen lassen. Dies sind zum einen die Fragen nach Nachteilen und Vorteilen des PTM, aber auch Fragen direkt zum Nutzen des PTM. So sollten Studierende, welche den PTM nutzen, auch mit anderen Personen &#252;ber ihre Ergebnisse reden, wie z. B. mit ihrem&#47;ihrer Mentor&#47;in, um mit ihm bzw. ihr das eigene Lernverhalten zu &#228;ndern. </Pgraph><Pgraph>Die wahrgenommenen Kosten wurden &#252;ber zwei offene Fragen abgefragt: </Pgraph><Pgraph><UnorderedList><ListItem level="1">F&#252;hlen Sie sich emotional durch den PTM eingeschr&#228;nkt&#63; (Frage 1)</ListItem><ListItem level="1">Welche Nachteile sehen Sie beim PTM&#63; (Frage 2)</ListItem></UnorderedList></Pgraph><Pgraph>Der wahrgenommene Nutzen wurde &#252;ber f&#252;nf Fragen (zwei geschlossene und drei offene Fragen) zu verschiedenen Aspekten ermittelt: </Pgraph><Pgraph><UnorderedList><ListItem level="1">Dialog mit anderen Personen &#252;ber die Ergebnisse beim PTM mit den Unterfragen:</ListItem><UnorderedList><ListItem level="2">Ich rede mit Kommilitonen &#252;ber meine Ergebnisse beim PTM. (Likert-Item mit 1 &#8222;trifft nicht zu&#8220; bis 5 &#8222;trifft zu&#8220;),</ListItem></UnorderedList><UnorderedList><ListItem level="2">Ich rede mit meinem Mentor &#252;ber meine Ergebnisse beim PTM. (Likert-Item mit 1 &#8222;trifft nicht zu&#8220; bis 5 &#8222;trifft zu&#8220;),</ListItem></UnorderedList><UnorderedList><ListItem level="2">Ich rede mit anderen Menschen &#252;ber meine Ergebnisse beim PTM. Und zwar mit &#8230; (offene Frage, Frage 3).</ListItem></UnorderedList><ListItem level="1">Nutzen Sie die Ergebnisse des PTM noch anderweitig&#63; (offene Frage, Frage 4)</ListItem><ListItem level="1">Welche Vorteile sehen Sie beim PTM&#63; (offene Frage, Frage 5)</ListItem></UnorderedList></Pgraph><Pgraph>Es gab keine Einschr&#228;nkung hinsichtlich der Anzahl der Kommentare, welche die Studierenden zu den offenen Fragen abgeben konnten. </Pgraph><Pgraph>Zus&#228;tzlich wurden im Fragebogen das Geschlecht und die Studiensemester abgefragt, um die Vergleichbarkeit beider Gruppen pr&#252;fen zu k&#246;nnen. </Pgraph><SubHeadline2>Versuchsdurchf&#252;hrung</SubHeadline2><Pgraph>An Fakult&#228;t 1 und 2 fand der PTM in den ersten Wochen des Semesters in den R&#228;umlichkeiten der Hochschule und unter Aufsicht statt. F&#252;r jede Kohorte wurden mindestens zwei &#252;berschneidungsfreie Termine geplant, die von den Studierenden selbstst&#228;ndig gew&#228;hlt werden konnten. An beiden Fakult&#228;ten erfolgte die Testung computerbasiert. An Fakult&#228;t 2 wurden zus&#228;tzlich Termine f&#252;r eine papierbasierte Testung angeboten.</Pgraph><Pgraph>Die Studierenden an beiden Fakult&#228;ten nahmen regul&#228;r am PTM-Termin teil. Zu Beginn des Tests wurde neben der regul&#228;ren Einf&#252;hrung auch &#252;ber die Gesamtstudie informiert. Die Gesamtstudie untersucht die Motivation beim PTM und seinen Einfluss auf das Lernen beim PTM. Daher enthielt der Fragebogen mehr als die hier angegebenen Fragen. Die Teilnehmenden wurden in der regul&#228;ren Einf&#252;hrung gebeten, den Fragebogen im Anschluss an die Testbearbeitung auszuf&#252;llen und wurden darauf hingewiesen, dass diese Teilnahme freiwillig und anonym ist. Die Ethikkommission der Medizinischen Fakult&#228;t Mannheim, Universit&#228;t Heidelberg, stellte ein positives Ethikvotum f&#252;r die Gesamtstudie aus (2015-542-N-MA). </Pgraph><SubHeadline2>Auswertung</SubHeadline2><Pgraph>Der Anteil nicht ernsthafter Testteilnehmender pro Fakult&#228;t wurde jeweils mit einem &#967;<Superscript>2</Superscript>-Test auf Unabh&#228;ngigkeit &#252;berpr&#252;ft. Da die Stichprobe sehr gro&#223; ist und demzufolge auch kleine Unterschiede signifikant werden k&#246;nnen, wurde zus&#228;tzlich die Effektst&#228;rke Cohens w f&#252;r Kontingenztabellen und Cohens d f&#252;r metrische Daten (s. u.) berechnet, um die inhaltliche Relevanz von Unterschieden zu beurteilen &#91;25&#93;. Die Effektst&#228;rke w ist kategorisiert als kein Effekt mit w&#60;0,1, kleiner Effekt mit w&#60;0,3, moderater Effekt mit w&#60;0,5 sowie gro&#223;er Effekt mit w&#8805;0,5 <TextLink reference="25"></TextLink>. </Pgraph><Pgraph>F&#252;r den Vergleich der TESS-Scores zwischen den beiden Fakult&#228;ten wurde ein t-Test f&#252;r unabh&#228;ngige Stichproben mit ungleichen Varianzen berechnet, sowie die Effektst&#228;rke d nach Cohen <TextLink reference="25"></TextLink>, wobei die gepoolte Standardabweichung nach Leonhart (2004) berechnet wurde <TextLink reference="26"></TextLink>. Die Kategorisierung von d lautet wie folgt: d&#60;0,2 kein Effekt, d&#60;0,5 kleiner Effekt, d&#60;0,8 moderater Effekt und d&#8805;0,8 gro&#223;er Effekt. </Pgraph><Pgraph>Die Auswertung der beiden Likert-Items (&#8222;Ich rede mit Kommilitonen&#8230;&#8220; bzw. &#8222;&#8230;mit meinem Mentor &#252;ber meine Ergebnisse beim PTM&#8220;) wurden umkodiert, sodass Angaben von 4 oder 5 als Zustimmung gewertet wurden. </Pgraph><Pgraph>Zur Auswertung der offenen Fragen zu den Kosten und Nutzen des PTM wurden qualitative und quantitative Methoden verwendet. Die Daten des Fragebogens wurden in drei Schritten analysiert: Zun&#228;chst untersuchten zwei Autorinnen (KG, MZ) alle Kommentare der offenen Fragen und codierten sie unabh&#228;ngig voneinander anhand der thematischen Inhaltsanalyse <TextLink reference="27"></TextLink>. In einem zweiten Schritt nach gemeinsamer Diskussion von Diskrepanzen und neuen Perspektiven wurden diese Codes wiederum unabh&#228;ngig voneinander in Kategorien gruppiert und eine Kategorienliste erstellt. Im dritten Schritt wurde diese Kategorienliste hinsichtlich der Inter-Coder-Reliabilit&#228;t &#252;berpr&#252;ft mit perfekten &#220;bereinstimmungen (je 100&#37;) f&#252;r die offenen Fragen 1 (8 Kategorien), 3 (7 Kategorien) und 4 (4 Kategorien). Sehr gute &#220;bereinstimmungen ergaben sich f&#252;r die offene Frage 2 (94&#37;, 9 Kategorien) und Frage 5 (97&#37;, 12 Kategorien), so dass diese Kategorienliste in den weiteren Analysen verwendet wurde. Im Ergebnisteil wird die Anzahl der Nennungen pro Kategorie angegeben. Die dazugeh&#246;rigen Prozentzahlen beziehen sich jeweils auf die Gesamtanzahl der Nennungen f&#252;r die angegebene Frage. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Results">
      <MainHeadline>Results</MainHeadline><SubHeadline2>Descriptives</SubHeadline2><Pgraph>415 students at F1 and 453 students at F2 took part in the survey. 234 students at F1 answered the questions included in the analysis (57&#37; female, respondents&#61;56&#37; of the sample, 234&#47;415). At F2, 248 students answered these questions (71&#37; female; respondents&#61;55&#37; of the sample, 248&#47;453). An overview can be found in table 2 <ImgLink imgNo="2" imgType="table"/>. </Pgraph><Pgraph>The two universities differed in a statistically significant manner in the distribution of the sexes (&#967;<Superscript>2</Superscript>&#61;10.52, df&#61;1, p&#60;.001) with a higher proportion of women at F2, but not in the distribution of students in the pre-clinical and clinical phase of their undergraduate training (n. s.). No statistically significant effects were found in preliminary analyses, so that the variable sex was not included as a covariate in the evaluations. </Pgraph><SubHeadline2>Proportion of non-serious test takers on the BPT </SubHeadline2><Pgraph>Regardless of the approach to operationalisation, it is shown that at Faculty 1 the proportion of non-serious test takers is significantly higher than at Faculty 2.</Pgraph><Pgraph>At F1 there are N<Subscript>F1</Subscript>&#61;173&#47;1,410 (12&#37;) students who answered all questions on the BPT with &#8220;don&#39;t know&#8221; or not at all, at F2 there are N<Subscript>F2</Subscript>&#61;5&#47;1,191 (&#60;1&#37;). This is a significant difference with &#967;<Superscript>2</Superscript>(1)&#61;142.20; p&#60;0.001 and a small effect of w&#61;0.23. </Pgraph><Pgraph>On the questionnaire, the following average TESS values, which reflect the self-evaluated test effort, were calculated at F1 for 291&#47;415 (70&#37;) students: M<Subscript>F1</Subscript>&#61;2.51; SD<Subscript>F1</Subscript>&#61;1.08 and at F2 of 409&#47;453 (90&#37;) students M<Subscript>F2</Subscript>&#61;3.63, SD<Subscript>F2</Subscript>&#61;0.88. This difference is also significant with T(543.80)&#61;14.68; p&#60;0.001 and has a large effect of d&#61;-1.19. The testing effort of the students at F2 was therefore significantly greater than at F1. If the test takers are categorized as serious vs. not serious, there are N<Subscript>F1</Subscript>&#61;52&#47;415 (13&#37;) and N<Subscript>F2</Subscript>&#61;3&#47;453 (&#60;1&#37;) non-serious test takers. This difference is also significant with &#967;<Superscript>2</Superscript>(1)&#61;68.96; p&#60;0.001 and a moderate effect (w&#61;0.31). </Pgraph><SubHeadline2>Perceived costs at faculties with different examination and feedback conditions </SubHeadline2><Pgraph>Overall, the students from F1 reported more frequently on perceived costs of the BPT. F2 received more positive, constructive comments than F1. Multiple answers were possible when answering Question 1: <Mark2>&#8220;Do you feel emotionally impaired by the BPT&#63;&#8221;</Mark2> At F1 there were 55 responses (24&#37; of the 234 respondents) to this question, of which 53&#37; (29&#47;55) were constructive. Of the 19 mentions (8&#37; of the 248 respondents) at F2 who answered this question, 15&#47;19 (79&#37;) were constructive. Table 3 <ImgLink imgNo="3" imgType="table"/> shows the allocation of responses to the individual categories per faculty. </Pgraph><Pgraph>Question 2 <Mark2>&#8220;What disadvantages do you see in the BPT&#63;&#8221;</Mark2> resulted in 241 responses at F1 (103&#37; of the 234 respondents; viz. some multiple responses), 43&#37; of which (104&#47;241) were constructive responses. At F2, 65&#47;105 (62&#37;) of 105 responses (42&#37; of the 248 responders) were constructive. The allocation of responses to the individual categories per faculty is shown in table 4 <ImgLink imgNo="4" imgType="table"/>.  </Pgraph><SubHeadline2>Perceived benefit at faculties with different examination and feedback conditions </SubHeadline2><Pgraph>163 (39&#37;) of the students from F1 and 309 (68&#37;) of the students from F2 talk to other people about their BPT results. 84 (20&#37;) of the students from F1 agreed with the statement that they talked with their fellow students about their BPT results. At F2 this number was 147 (32&#37;). The statement that they talked with their mentor about their own results on the BPT was agreed with by 4 (1&#37;) of the F1 students and 16 (4&#37;) of the F2 students. A total of 75 (18&#37;) of the participating F1 medical students and 146 (32&#37;) of the F2 students talked with others about their BPT results. The frequency of agreement on the two closed questions, as well as the allocation of mentions to the individual categories per faculty for the other persons (open Question 3), are listed in table 5 <ImgLink imgNo="5" imgType="table"/>. </Pgraph><Pgraph>Question 4 <Mark2>&#8220;Do you use the results of the BPT for other purposes&#63; If so, how&#63;&#8221;</Mark2> There were 72&#47;234 responses from F1 (31&#37; of respondents) and 33&#47;248 responses from F2 (13&#37; of respondents). Although there were more responses at F1 than at F2, a high percentage of the responses from F1 were more likely to be in categories with negative connotations (70&#47;72 responses, 97&#37;), compared to only 22&#47;33 responses (67&#37;) from F2 with more negative connotations, as documented in table 6 <ImgLink imgNo="6" imgType="table"/>. </Pgraph><Pgraph>In response to Question 5 <Mark2>&#8220;What advantages do you see in the BPT&#63;&#8221;</Mark2> there were just over 200 responses from both faculties (F1 with 207&#47;234, 88&#37; and F2 with 202&#47;248, 81&#37; of the respondents). At F1 163&#47;234 (79&#37;) of the responses could be assigned to positive categories, at F2 198&#47;248 (98&#37;), as shown in table 7 <ImgLink imgNo="7" imgType="table"/>. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><SubHeadline2>Deskriptive Statistik</SubHeadline2><Pgraph>415 Studierende an F1 sowie 453 Studierende an F2 nahmen an der Befragung teil. 234 Studierende der F1 beantworteten die in die Analyse einbezogenen Fragen (57&#37; weiblich, Responder&#61;56&#37; der Stichprobe, 234&#47;415). An F2 beantworteten 248 Studierende diese Fragen (71&#37; weiblich; Responder&#61;55&#37; der Stichprobe, 248&#47;453). Eine &#220;bersicht findet sich in Tabelle 2 <ImgLink imgNo="2" imgType="table"/>. </Pgraph><Pgraph>Die beiden Universit&#228;ten unterschieden sich statistisch signifikant hinsichtlich der Verteilung der Geschlechter (&#967;<Superscript>2</Superscript>&#61;10,52, df&#61;1, p&#60;,001) mit einem h&#246;heren Frauenanteil bei F2, jedoch nicht in der Verteilung der Studierenden auf den vorklinischen und klinischen Abschnitt des Studiums (n. s.). In Voranalysen zeigten sich keine statistisch signifikanten Effekte, so dass die Variable Geschlecht in den Auswertungen nicht als Kovariate einbezogen wurde. </Pgraph><SubHeadline2>Anteile nicht ernsthafter Testteilnehmender beim PTM </SubHeadline2><Pgraph>Unabh&#228;ngig von der Berechnung und der gew&#228;hlten Operationalisierung zeigt sich, dass in Fakult&#228;t 1 der Anteil nicht ernsthafter Testteilnehmender deutlich h&#246;her ist als in Fakult&#228;t 2.</Pgraph><Pgraph>An F1 gibt es N<Subscript>F1</Subscript>&#61;173&#47;1.410 (12&#37;) Studierende, die beim PTM alle Fragen mit &#8222;wei&#223; nicht&#8220; bzw. gar nicht beantwortet haben, an F2 N<Subscript>F2</Subscript>&#61;5&#47;1.191 (&#60;1&#37;). Dies ist ein signifikanter Unterschied mit &#967;<Superscript>2</Superscript>(1)&#61;142,20; p&#60;0,001 und einem kleinen Effekt von w&#61;0,23. </Pgraph><Pgraph>Im Fragebogen wurden an F1 von 291&#47;415 (70&#37;) Studierenden folgende durchschnittliche TESS-Werte, die das selbsteingesch&#228;tzte Testbem&#252;hen widerspiegeln, angekreuzt: M<Subscript>F1</Subscript>&#61;2,51; SD<Subscript>F1</Subscript>&#61;1,08 und an F2 von 409&#47;453 (90&#37;) Studierenden M<Subscript>F2</Subscript>&#61;3,63, SD<Subscript>F2</Subscript>&#61;0,88. Dieser Unterschied ist ebenfalls signifikant mit T(543,80)&#61;14,68; p&#60;0,001 und einem gro&#223;en Effekt von d&#61;-1,19. Das Testbem&#252;hen der Studierenden an F2 war demnach deutlich gr&#246;&#223;er als an F1. Wenn man die Testteilnehmenden in ernsthaft vs. nicht ernsthaft kategorisiert, gibt es N<Subscript>F1</Subscript>&#61;52&#47;415 (13&#37;) bzw. N<Subscript>F2</Subscript>&#61;3&#47;453 (&#60;1&#37;) nicht ernsthafte Testteilnehmende. Dieser Unterschied ist ebenfalls signifikant mit &#967;<Superscript>2</Superscript>(1)&#61;68,96; p&#60;0,001 und einem moderaten Effekt (w&#61;0,31). </Pgraph><SubHeadline2>Wahrgenommene Kosten in Fakult&#228;ten mit unterschiedlichen Pr&#252;fungs- und Feedbackbedingungen </SubHeadline2><Pgraph>Insgesamt berichteten die Studierenden aus F1 h&#228;ufiger von wahrgenommenen Kosten des PTM. An F2 wurden insgesamt mehr positive, konstruktive Nennungen gegeben als in F1. Bei der Beantwortung der Frage 1 <Mark2>&#8222;F&#252;hlen Sie sich emotional durch den PTM eingeschr&#228;nkt&#63;&#8220;</Mark2> waren Mehrfachnennungen m&#246;glich. In F1 gab es 55 Nennungen (24&#37; der 234 Responder) zu dieser Frage, von denen 53&#37; (29&#47;55) konstruktiv waren. Von den 19 Nennungen (8&#37; der 248 Responder) aus F2, welche diese Frage beantworteten, waren 15&#47;19 (79&#37;) Nennungen konstruktiv. Die Zuordnung von Nennungen zu den einzelnen Kategorien pro Fakult&#228;t ist in Tabelle 3 <ImgLink imgNo="3" imgType="table"/> aufgef&#252;hrt. </Pgraph><Pgraph>Die Frage 2<Mark2> &#8222;Welche Nachteile sehen Sie beim PTM&#63;&#8220;</Mark2> ergab an F1 241 Nennungen (103&#37; der 234 Responder; d. h. einige Mehrfachnennungen), davon 43&#37; (104&#47;241) konstruktive Nennungen. An F2 waren von 105 Nennungen (42&#37; der 248 Responder) 65&#47;105 (62&#37;) konstruktiv. Die Zuordnung von Nennungen zu den einzelnen Kategorien pro Fakult&#228;t ist in Tabelle 4 <ImgLink imgNo="4" imgType="table"/> aufgef&#252;hrt.  </Pgraph><SubHeadline2>Wahrgenommener Nutzen in Fakult&#228;ten mit unterschiedlichen Pr&#252;fungs- und Feedbackbedingungen </SubHeadline2><Pgraph>163 (39&#37;) der Studierenden aus F1 sowie 309 (68&#37;) der Studierenden aus F2 reden mit anderen Personen &#252;ber ihre Ergebnisse beim PTM. Dabei stimmten 84 (20&#37;) der Studierenden der F1 der Aussage zu, dass sie mit ihren Kommiliton&#47;innen &#252;ber ihre Ergebnisse beim PTM reden. An der F2 waren dies 147 (32&#37;). Der Aussage, dass sie mit ihrer Mentorin &#47; ihrem Mentor &#252;ber die eigenen Ergebnisse beim PTM reden, stimmten 4 (1&#37;) der Studierenden der F1 zu und 16 (4&#37;) der F2. Mit anderen Personen reden insgesamt 75 (18&#37;) der teilnehmenden Medizinstudierenden der F1 sowie 146 (32&#37;) der F2 &#252;ber ihre PTM Ergebnisse. Die H&#228;ufigkeit der Zustimmung zu den beiden geschlossenen Fragen sowie die Zuordnung von Nennungen zu den einzelnen Kategorien pro Fakult&#228;t f&#252;r die anderen Personen (offene Frage 3) sind in Tabelle 5 <ImgLink imgNo="5" imgType="table"/> aufgef&#252;hrt. </Pgraph><Pgraph>Bei der Frage 4 <Mark2>&#8222;Nutzen Sie die Ergebnisse des PTM noch anderweitig&#63; Wenn ja, wie&#63;&#8220;</Mark2> gab es 72&#47;234 Nennungen an F1 (31&#37; der Responder), und 33&#47;248 Nennungen (13&#37; der Responder) an F2. Obwohl es an der F1 insgesamt mehr Nennungen f&#252;r eine anderweitige Nutzung gab als an der F2, waren die Nennungen von F1 zu einem hohen Prozentsatz eher Kategorien mit negativer Konnotation (70&#47;72 Nennungen, 97&#37;) zuzuordnen, im Vergleich dazu gab es an F2 nur 22&#47;33 Nennungen (67&#37;) mit eher negativer Konnotation, wie in Tabelle 6 <ImgLink imgNo="6" imgType="table"/> dokumentiert. </Pgraph><Pgraph>Auf die Frage 5 <Mark2>&#8222;Welche Vorteile sehen Sie beim PTM&#63;&#8220;</Mark2> gab es an beiden Fakult&#228;ten knapp &#252;ber 200 Nennungen (F1 mit 207&#47;234, 88&#37; bzw. F2 mit 202&#47;248, 81&#37; der Responder). In F1 konnten 163&#47;234 (79&#37;) der Nennungen positiven Kategorien zugeordnet werden, in F2 198&#47;248 (98&#37;), wie in Tabelle 7 <ImgLink imgNo="7" imgType="table"/> ersichtlich. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Discussion">
      <MainHeadline>Discussion</MainHeadline><Pgraph>Formative assessment is important as an essential part of the assessment for learning. If formative assessment is not graded, it may be perceived by students as having high costs and&#47;or lower benefits compared to summative assessment. In these cases, the proportion of non-serious test takers may be high. The present study investigated whether different framework conditions at two faculties have an influence on the test effort and the perceived costs and benefits of a formative assessment &#8211; the Berlin Progress Test (BPT). The different framework conditions can be found in the required number of participations in the BPT during undergraduate training, the presentation of the BPT, the feedback on the results, as well as the university&#8217;s implementation. Although both medical faculties are implementing measures to increase the acceptance of the BPT in order to increase test effort, the BPT is better accepted by students at Faculty 2 than at Faculty 1, as evidenced by the higher proportion of serious test takers, the lower perceived costs and higher reported benefits, and the greater proportion of constructive comments. </Pgraph><SubHeadline2>Serious test taking</SubHeadline2><Pgraph>The hypothesis <Mark2>&#8220;The proportion of non-serious test takers at Faculty 1 is lower than at Faculty 2&#8221;</Mark2> could not be confirmed. Contrary to this hypothesis, the proportion of serious test takers at Faculty 1 is lower than at Faculty 2, despite more choices and immediate feedback. Although it has been shown elsewhere that the proportion of serious respondents is higher in computer-based administration than in paper-based administration <TextLink reference="28"></TextLink>, several studies have already shown that several factors influence test effort. Therefore, unicentric studies can only make a marginal contribution to the explanation of the multifactorial conditions for the test effort on formative tests. </Pgraph><SubHeadline2>Costs </SubHeadline2><Pgraph>The present study was able to confirm the hypothesis &#8220;The<Mark2> perceived costs of the BPT are higher at Faculty 1 than at Faculty 2.&#8221;</Mark2>. The comments of the participants reflect findings from the literature that the costs of the BPT are perceived as high if the students estimate that they cannot simultaneously perform higher rated alternatives, such as learning for &#8220;real&#8221; assessment or if they feel emotional stress when filling out the test <TextLink reference="29"></TextLink>. </Pgraph><SubHeadline2>Benefits</SubHeadline2><Pgraph>The results for testing the hypothesis &#8220;<Mark2>The perceived benefit of the BPT is lower at Faculty 1 than at Faculty 2&#8221;</Mark2> must be considered in a more differentiated way. Although more students at Faculty 2 talk about their BPT results, half of those people are from outside the faculty. This is surprising because the BPT should be part of the undergraduate training and therefore students would be expected to talk mainly with their fellow students and mentors about their results. However, a mentor was rarely mentioned in answering this question, although a mentoring programme is available at F2. When asked whether students use the BPT results for other purposes, the proportion of comments made by students at Faculty 1 was higher than that of students at Faculty 2. However, this is a very high proportion of comments with negative connotations or comments that show that the results are not used for other purposes. Faculty 2 students have a better understanding of the principle behind formative testing and use the BPT results as feedback on their own knowledge progress, motivation to learn and reduction of exam fear. Although the attitude towards the BPT is more positive at Faculty 2, students at both faculties rarely mentioned that they use the BPT as a learning tool (10 mentions out of a total of 482 students who completed the questionnaire). The effect on learning is therefore questionable. However, this would be a quality criterion for the utility of an assessment method <TextLink reference="4"></TextLink>, especially in formative assessment where the function of the assessment is to stimulate and provide feedback on learning. The learning effect must be investigated more closely in further studies, especially since the effect on learning is questionable even in the case of moderate-stakes progress tests. Only a moderate role of the progress test in identifying strengths and weaknesses could be identified <TextLink reference="30"></TextLink>. Aarts et al. showed that a majority of students used the results of the moderate-stakes progress test to monitor their knowledge, but it was not clear whether this also had a direct influence on learning <TextLink reference="31"></TextLink>. This was also shown by Given et al. They found in semi-structured interviews that, although the students felt informed about their strengths and weaknesses, the feedback had no influence on future learning <TextLink reference="32"></TextLink>. Yielder et al. also found with focus groups that in younger students, future learning is influenced by the progress test, but not by the feedback, rather by the content of the test <TextLink reference="33"></TextLink>. Students in advanced semesters are more likely to use the progress test as a reminder that they need to learn at all. The proportion of comments on the benefits of the BPT in the present study is roughly comparable at both faculties, but it is also apparent that students at Faculty 2 are more positive about the BPT. It can therefore be concluded that the hypothesis on the perceived benefit of the BPT can be confirmed, but to limit this, its effect as a learning instrument is also questionable at Faculty 2.</Pgraph><SubHeadline2>Strengths and weaknesses</SubHeadline2><Pgraph>In the present study it could be shown that different conditions of assessment and feedback can be associated with different proportions of serious test takers and thus with an increased variance in test efforts. It also showed that the costs and benefits of the progress test are perceived differently at the two faculties. Faculty 2 not only had more serious test takers, but the BPT was also perceived more positively in terms of costs and benefits than at Faculty 1. </Pgraph><Pgraph>The advantage of the present study is the direct comparison of two medical faculties where the BPT was introduced at the same time more than 15 years ago. The conditions at both faculties are comparable in many respects: both have a model study programme and three licensing state examinations, which can have an influence on the BPT results <TextLink reference="34"></TextLink>. Both faculties have comparable implementation conditions for the BPT, such as the same test, mandatory participation and no admission to further courses if the BPT is not taken. On the other hand, the two conditions for the implementation of the BPT differ in their different integration into the quality management system vs. into the assessment system and in the feedback (immediate feedback of results in the case of computer-based testing vs. comparison with the solution booklet on request). In addition to the comparable conditions at the two faculties, the present study offers the mixed-method approach as a further methodological advantage, which allows both quantitative and qualitative analyses. Thus a better insight into the perception of the BPT at the two faculties was gained and it could also be shown quantitatively that the percentage of serious test takers differs greatly between the two faculties. </Pgraph><Pgraph>The methods used to determine the proportion of serious and non-serious test takers each have limitations in their validity, such as an unknown degree of sensitivity&#47;specificity (&#8220;objective criteria&#8221;) and the questionable significance of the self-reports (TESS score). In order to increase the validity of the results, triangulation was used to measure the test effort with different methods. Since both methods lead to the same conclusion, it can be assumed that the test effort is higher at Faculty 2 than at Faculty 1. Furthermore, the answers from the open questions also allow this conclusion to be drawn, since more constructive answers were given at Faculty 2 and also a higher benefit and lower costs were reported. According to the Expectancy Value Theory, the motivation to complete this task, meaning the test effort on the BPT, should therefore be higher at Faculty 2 than at Faculty 1.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Formative Pr&#252;fungen sind wichtig als essentieller Teil des Pr&#252;fens f&#252;r das Lernen. Wenn formative Pr&#252;fungen nicht bestehensrelevant sind, k&#246;nnen sie im Empfinden der Studierenden hohe Kosten und&#47;oder geringeren Nutzen im Vergleich zu summativen Pr&#252;fungen haben. In diesen F&#228;llen kann der Anteil nicht ernsthafter Testteilnehmender hoch sein. In der vorliegenden Studie wurde untersucht, ob unterschiedliche Rahmenbedingungen an zwei Fakult&#228;ten einen Einfluss auf das Testbem&#252;hen sowie die wahrgenommenen Kosten und Nutzen einer formativen Pr&#252;fung &#8211; des Progress Tests Medizin (PTM) &#8211; haben. Die unterschiedlichen Rahmenbedingungen finden sich in der geforderten Anzahl der Teilnahmen, der Darbietung des PTM, der R&#252;ckmeldung der Ergebnisse sowie der universit&#228;ren Einbindung. Obwohl an beiden medizinischen Fakult&#228;ten Ma&#223;nahmen zur Erh&#246;hung der Akzeptanz des PTM durchgef&#252;hrt werden, um das Testbem&#252;hen zu steigern, wird der PTM von den Studierenden an Fakult&#228;t 2 besser angenommen als an Fakult&#228;t 1. Dies zeigt sich in dem h&#246;heren Anteil ernsthafter Testteilnehmender, den niedrigeren wahrgenommenen Kosten und dem h&#246;heren berichteten Nutzen sowie dem gr&#246;&#223;eren Anteil an konstruktiven Kommentaren. </Pgraph><SubHeadline2>Ernsthafte Testteilnahme</SubHeadline2><Pgraph>Die Hypothese &#8222;Der Anteil nicht ernsthafter Testteilnehmender an Fakult&#228;t 1 ist niedriger als an Fakult&#228;t 2.&#8220; konnte nicht best&#228;tigt werden. Entgegen dieser Hypothese ist der Anteil ernsthafter Testteilnehmender an Fakult&#228;t 1 kleiner als an Fakult&#228;t 2, trotz mehr Wahlm&#246;glichkeiten und einem unmittelbaren Feedback. Obwohl an anderer Stelle gezeigt werden konnte, dass bei computer-basierter Administration der Anteil ernsthafter Testteilnehmender h&#246;her ist als bei papier-basierter Administration <TextLink reference="28"></TextLink>, haben bereits verschiedene Studien gezeigt, dass mehrere Faktoren Einfluss auf das Testbem&#252;hen haben. Unizentrische Studien k&#246;nnen deshalb nur einen marginalen Erkl&#228;rungsbeitrag liefern, um das multifaktorielle Bedingungsgef&#252;ge f&#252;r das Testbem&#252;hen in formativen Pr&#252;fungen vollst&#228;ndig aufzukl&#228;ren. </Pgraph><SubHeadline2>Kosten </SubHeadline2><Pgraph>Die vorliegende Studie konnte die Hypothese &#8222;Die wahrgenommenen Kosten des PTM sind an Fakult&#228;t 1 h&#246;her als an Fakult&#228;t 2.&#8220; best&#228;tigen. An Fakult&#228;t 1 werden von den Teilnehmenden mehr Kosten dargelegt als an Fakult&#228;t 2. Die Kommentare der Teilnehmenden spiegeln Befunde aus der Literatur wider, dass die Kosten des PTM als hoch wahrgenommen werden, wenn die Studierenden einsch&#228;tzen, dass sie zur gleichen Zeit keine h&#246;her bewerteten Alternativen durchf&#252;hren k&#246;nnen, wie Lernen auf &#8222;richtige&#8220; Pr&#252;fungen oder wenn sie emotionalen Stress beim Ausf&#252;llen des Tests empfinden <TextLink reference="29"></TextLink>. </Pgraph><SubHeadline2>Nutzen</SubHeadline2><Pgraph>Die Ergebnisse zur &#220;berpr&#252;fung der Hypothese &#8222;Der wahrgenommene Nutzen des PTM ist an Fakult&#228;t 1 niedriger als an Fakult&#228;t 2.&#8220; m&#252;ssen differenzierter betrachtet werden. Obwohl mehr Studierende an Fakult&#228;t 2 &#252;ber ihre PTM-Ergebnisse sprechen, handelt es sich hierbei zur H&#228;lfte um fakult&#228;tsferne Personen. Dies ist verwunderlich, da der PTM ein Teil des Studiums sein sollte und daher zu erwarten w&#228;re, dass die Studierenden haupts&#228;chlich mit ihren Kommiliton&#47;innen und Mentor&#47;innen &#252;ber die Ergebnisse reden. Eine Mentorin&#47;ein Mentor wurde bei der Beantwortung dieser Frage jedoch nur selten genannt, obwohl es an F2 ein Mentorenprogramm gibt. Bei der Frage, ob die Studierenden die Ergebnisse des PTM noch anderweitig nutzen, war der Anteil der Kommentare der Studierenden an Fakult&#228;t 1 h&#246;her als bei den Studierenden der Fakult&#228;t 2. Allerdings handelt es sich hierbei um einen sehr hohen Anteil an Kommentaren mit negativer Konnotation bzw. Kommentare, die zeigen, dass die Ergebnisse nicht anderweitig genutzt werden. Studierende der Fakult&#228;t 2 haben das Prinzip des formativen Pr&#252;fens besser verstanden und nutzen die Ergebnisse des PTM als Feedback &#252;ber den eigenen Wissensfortschritt, zur Lernmotivation und zur Reduktion von Pr&#252;fungsangst. Obwohl an Fakult&#228;t 2 die Einstellung gegen&#252;ber dem PTM positiver ist, haben an beiden Fakult&#228;ten Studierende nur in den seltensten F&#228;llen erw&#228;hnt, dass sie den PTM als Lerninstrument verwenden (10 Nennungen von insgesamt 482 Studierenden, die den Fragebogen ausgef&#252;llt haben). Daher ist die Wirkung auf das Lernen fraglich. Dies w&#228;re jedoch ein Qualit&#228;tskriterium f&#252;r die N&#252;tzlichkeit einer Pr&#252;fung <TextLink reference="4"></TextLink>, v. a. bei formativen Pr&#252;fungen, deren Funktion das Pr&#252;fen als eine Anregung und R&#252;ckmeldung zum Lernen ist. Die Lernwirkung muss genauer in weiteren Studien untersucht werden, zumal auch bei bestehensrelevanten Progress Tests die Wirkung auf das Lernen fraglich ist. So konnte nur eine moderate Rolle des Progress Tests bei der Identifikation von St&#228;rken und Schw&#228;chen ausgemacht werden <TextLink reference="30"></TextLink>. Aarts et al. zeigten, dass eine Mehrheit der Studierenden die Ergebnisse des bestehensrelevanten Progress Tests zum Monitoren ihres Wissens nutzten, jedoch war nicht klar, ob dies auch einen direkten Einfluss auf das Lernen hatte <TextLink reference="31"></TextLink>. Dies zeigte sich auch bei Given et al. Sie fanden in semi-strukturierten Interviews heraus, dass sich die Studierenden zwar &#252;ber ihre St&#228;rken und Schw&#228;chen informiert f&#252;hlten, das Feedback jedoch keinen Einfluss auf das zuk&#252;nftige Lernen hatte <TextLink reference="32"></TextLink>. Auch Yielder et al. fanden in Fokusgruppen heraus, dass bei j&#252;ngeren Studierenden das zuk&#252;nftige Lernen durch den Progress Test beeinflusst wird, jedoch nicht durch das Feedback, sondern durch den Inhalt des Tests <TextLink reference="33"></TextLink>. Studierende in h&#246;heren Fachsemestern nutzen den Progress Test eher als Erinnerungen daran, dass sie &#252;berhaupt lernen m&#252;ssen. Der Anteil der Kommentare zu den Vorteilen des PTM in der vorliegenden Studie ist in beiden Fakult&#228;ten ungef&#228;hr vergleichbar, jedoch zeigt sich auch hier, dass die Studierenden der Fakult&#228;t 2 den PTM positiver beurteilen. Daher kann gefolgert werden, dass die Hypothese zum wahrgenommenen Nutzen des PTM best&#228;tigt werden kann, einschr&#228;nkend kommt jedoch hinzu, dass die Wirkung als Lerninstrument auch an Fakult&#228;t 2 fraglich ist. </Pgraph><SubHeadline2>St&#228;rken und Schw&#228;chen</SubHeadline2><Pgraph>In der vorliegenden Studie konnte gezeigt werden, dass verschiedene Pr&#252;fungs- und Feedbackbedingungen mit unterschiedlichen Anteilen ernsthafter Testteilnehmender und damit einer erh&#246;hten Varianz des Testbem&#252;hens verbunden sein k&#246;nnen. Zudem wurde ersichtlich, dass die Kosten und der Nutzen des Progress Tests an beiden Fakult&#228;ten unterschiedlich wahrgenommen werden. An Fakult&#228;t 2 waren nicht nur mehr ernsthafte Testteilnehmende vorhanden, sondern der PTM wurde auch bzgl. Kosten und Nutzen positiver wahrgenommen als an Fakult&#228;t 1. </Pgraph><Pgraph>Der Vorteil der vorliegenden Studie liegt im direkten Vergleich zweier Medizinischer Fakult&#228;ten, bei denen der PTM zum gleichen Zeitpunkt vor &#252;ber 15 Jahren eingef&#252;hrt wurde. In vielen Punkten sind die Bedingungen an beiden Fakult&#228;ten vergleichbar: beide haben einen Modellstudiengang und drei Staatspr&#252;fungen, die Einfluss auf die PTM-Ergebnisse haben k&#246;nnen <TextLink reference="34"></TextLink>. Bei beiden Fakult&#228;ten gibt es vergleichbare Implementationsbedingungen des PTM, wie den gleichen Test, Teilnahmeverpflichtung sowie keine Zulassung zu weiteren Kursen, wenn am PTM nicht teilgenommen wird. Andererseits unterscheiden sich die beiden Bedingungen zur Implementierung des PTM durch die unterschiedliche Einbindung in das Qualit&#228;tsmanagementsystem bzw. in das Pr&#252;fungssystem sowie in der R&#252;ckmeldung (sofortige R&#252;ckmeldung der eigenen Ergebnisse bei computer-basierter Testung vs. auf Nachfrage Vergleich mit dem L&#246;sungsheft). Neben den vergleichbaren Bedingungen an den beiden Fakult&#228;ten bietet die vorliegende Studie als weiteren methodischen Vorteil den Mixed-Methods-Ansatz, der sowohl quantitative als auch qualitative Auswertungen erlaubt. Somit wurde ein besserer Einblick in die Wahrnehmung des PTM an den beiden Fakult&#228;ten gewonnen und es konnte zudem quantitativ gezeigt werden, dass sich der Anteil ernsthafter Testteilnahmen stark zwischen den beiden Fakult&#228;ten unterscheidet. </Pgraph><Pgraph>Die Methoden zur Bestimmung des Anteils ernsthafter bzw. nicht ernsthafter Testteilnahmen haben jede einzelne f&#252;r sich Einschr&#228;nkungen in ihrer Zuverl&#228;ssigkeit, wie ein unbekanntes Ausma&#223; an Sensitivit&#228;t&#47;Spezifit&#228;t (&#8222;objektive Kriterien&#8220;) und die fragliche Aussagekraft der Selbstauskunft (TESS-Score). Um die Validit&#228;t der Ergebnisse zu erh&#246;hen, wurde mit Hilfe von Triangulation das Testbem&#252;hen mit verschiedenen Methoden gemessen. Da beide Methoden zu der gleichen Schlussfolgerung f&#252;hren, kann davon ausgegangen werden, dass das Testbem&#252;hen an Fakult&#228;t 2 h&#246;her ist als an Fakult&#228;t 1. Au&#223;erdem lassen die Antworten aus den offenen Fragen ebenfalls diese Schlussfolgerung zu, da an Fakult&#228;t 2 mehr konstruktive Antworten gegeben wurden und auch ein h&#246;herer Nutzen und weniger Kosten berichtet wurden. Nach der Erwartungs-Wert-Theorie sollte daher die Motivation, diese Aufgabe zu erledigen, also beim PTM das Testbem&#252;hen, bei Fakult&#228;t 2 h&#246;her sein als bei Fakult&#228;t 1.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Conclusion">
      <MainHeadline>Conclusion</MainHeadline><Pgraph>The formative BPT as an assessment for learning is intended to give students feedback on the amount of their own medical knowledge, compared to the level at which they will graduate and compared to fellow students of the same level of undergraduate training, in order to accompany and modulate the learning process in the context of continuous learning. It is intended to be an antithesis to bulimic learning, which can occur more frequently due to too many summative assessments <TextLink reference="2"></TextLink>. As with other low-stakes tests, there are large variances in test effort on the BPT and thus a questionable effect on learning. It can be assumed that measures to reduce the perceived costs and increase the perceived benefit can positively influence test effort and, in the long term, the effect on learning. Even if there is presumably no problem with the test effort on moderate-stakes progress tests, studies show the limited impact on learning. Therefore, framework conditions should be identified which positively influence the perceived costs and benefits of formative assessment and thus have a long-term effect on the learning process. Since the BPT provides data for feedback on the student&#39;s knowledge status as well as the learning progress, but the use of the BPT as a learning tool is up to the students, the BPT and the use of the results for their own learning should be embedded in the curriculum. This can be done by embedding the BPT in the assessment system, both as part of the assessment regulations and in the presentation of information and results, as at Faculty 2. Further possibilities for influencing perceived costs and benefits at a faculty would be to avoid contemporaneous summative assessment during formative assessment phases <TextLink reference="6"></TextLink>, <TextLink reference="8"></TextLink>, integration in the mentoring system for all students and not only as identification for the necessary support of underachieving students <TextLink reference="13"></TextLink>, <TextLink reference="30"></TextLink>, <TextLink reference="31"></TextLink>, <TextLink reference="35"></TextLink>, <TextLink reference="36"></TextLink>, <TextLink reference="37"></TextLink>. It would also be conceivable to use formative assessment to develop and follow up learning plans together with the mentor <TextLink reference="38"></TextLink>. If formative assessment is used to provide continuous feedback on knowledge, discussed with the mentor and serves to orient future learning, as envisaged in the programmatic assessment <TextLink reference="8"></TextLink>, <TextLink reference="39"></TextLink>, then it will serve its purpose. And only then students will see the value of formative assessment. </Pgraph><Pgraph>Although formative assessment is becoming increasingly important, it is not enough to introduce it as an add-on to the curriculum. Rather, new assessment formats also require the appropriate framework conditions to achieve the desired effect. In formative assessment, therefore, conditions must be created in which the results have a value, both as a guide through the undergraduate training and as guidance for learning behaviour. Only if equal importance is attached to formative and summative assessment will the perceived costs and benefits be comparable along with the test effort. Thus, the focus of students can be shifted to continuous learning, away from bulimic learning, because it can be assumed that students who focus their actions on merely passing MC exams will not be able to recognize the value of formative assessment at all. </Pgraph><Pgraph>Low-stakes assessment is a good way to learn under what conditions assessment for learning works and how it can be effectively embedded in existing curricula. Therefore, further studies should investigate the extent of the individual measures and their interaction. This is a great challenge since the investigation of real conditions in medical education is made difficult by many, often uncontrollable conditions <TextLink reference="40"></TextLink>.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Fazit">
      <MainHeadline>Fazit</MainHeadline><Pgraph>Der formative PTM als Pr&#252;fung f&#252;r das Lernen soll den Studierenden R&#252;ckmeldung &#252;ber den Stand des eigenen medizinischen Wissens geben, im Vergleich zum Absolvierendenniveau und im Vergleich zu den Kommiliton&#47;innen des gleichen Studienstandes, um im Rahmen des kontinuierlichen Lernens den Lernprozess zu begleiten und zu modulieren. Er soll dadurch ein Gegenpol zum sog. Bulimielernen sein, welches durch zu viele benotete Leistungsnachweise vermehrt auftreten kann <TextLink reference="2"></TextLink>. Wie auch bei anderen nicht-bestehensrelevanten Tests gibt es beim PTM gro&#223;e Schwankungen im Testbem&#252;hen und damit eine fragliche Wirkung auf das Lernen. Es ist anzunehmen, dass Ma&#223;nahmen zur Senkung der wahrgenommenen Kosten und zur Erh&#246;hung des wahrgenommenen Nutzens das Testbem&#252;hen und langfristig auch die Wirkung auf das Lernen positiv beeinflussen k&#246;nnen. Auch wenn bei bestehensrelevanten Progress Tests mutma&#223;lich kein Problem mit dem Testbem&#252;hen auftritt, zeigt sich in Studien die eingeschr&#228;nkte Lernwirkung. Daher sollten Rahmenbedingungen identifiziert werden, welche die wahrgenommenen Kosten und Nutzen formativer Pr&#252;fungen positiv beeinflussen und damit langfristig auch auf die Lernmodulation wirken. Da durch den PTM zwar Daten f&#252;r eine R&#252;ckmeldung zum Leistungsstand bzw. zum Leistungsverlauf geliefert werden, jedoch die Nutzung des PTM als Lernsteuerungsinstrument bei den Studierenden liegt, sollte der PTM und die Verwendung der Ergebnisse f&#252;r das eigene Lernen in das Curriculum eingebettet werden. Dies kann durch die Einbettung in das Pr&#252;fungssystem geschehen, sowohl als Teil der Pr&#252;fungsordnung als auch in der Darstellung der Informationen und der Ergebnisse, wie an Fakult&#228;t 2. Weitere M&#246;glichkeiten, wahrgenommene Kosten und Nutzen als Fakult&#228;t zu beeinflussen, w&#228;ren keine parallelen summativen Pr&#252;fungen zu den formativen Pr&#252;fungen <TextLink reference="6"></TextLink>, <TextLink reference="8"></TextLink>, eine Einbindung in das Mentorensystem f&#252;r alle Studierende und nicht nur als Identifikation f&#252;r notwendige F&#246;rderung leistungsschwacher Studierender <TextLink reference="13"></TextLink>, <TextLink reference="30"></TextLink>, <TextLink reference="31"></TextLink>, <TextLink reference="35"></TextLink>, <TextLink reference="36"></TextLink>, <TextLink reference="37"></TextLink>. Denkbar w&#228;re auch das Verwenden von formativen Pr&#252;fungen zur Erstellung und zum Nachhalten von Lernpl&#228;nen, zusammen mit dem Mentor&#47;der Mentorin <TextLink reference="38"></TextLink>. Wenn formative Pr&#252;fungen verwendet werden, um kontinuierlich Feedback zum Wissensstand zu sammeln, mit dem Mentor&#47;der Mentorin zu besprechen und das k&#252;nftige Lernen darauf auszurichten, wie es im programmatischen Assessment vorgesehen ist <TextLink reference="8"></TextLink>, <TextLink reference="39"></TextLink>, dann werden sie ihrem Zweck gerecht. Und erst dann werden die Studierenden den Wert formativer Pr&#252;fungen erkennen. </Pgraph><Pgraph>Obwohl formative Pr&#252;fungen immer mehr an Bedeutung gewinnen, reicht es nicht, diese als Add-on in das Curriculum einzuf&#252;hren. Neue Pr&#252;fungsformate ben&#246;tigen vielmehr auch die entsprechenden Rahmenbedingungen, damit sie den gew&#252;nschten Effekt erzielen. Bei formativen Pr&#252;fungen m&#252;ssen daher Bedingungen geschaffen werden, in denen die Ergebnisse einen Wert haben und zwar als Leitfaden durch das Studium und als Lenkung des Lernverhaltens. Nur wenn formativen und summativen Pr&#252;fungen gleich viel Bedeutung beigemessen wird, werden die wahrgenommenen Kosten und Nutzen vergleichbar sein und das Testbem&#252;hen ebenfalls. Somit kann der Fokus der Studierenden auf das kontinuierliche Lernen gelenkt werden, weg vom Bulimielernen, denn es ist anzunehmen, dass Studierende, welche ihr Handeln auf das blo&#223;e Bestehen von MC-Pr&#252;fungen ausrichten, den Wert von formativen Pr&#252;fungen &#252;berhaupt nicht erkennen k&#246;nnen. </Pgraph><Pgraph>Nicht-bestehensrelevante Pr&#252;fungen sind eine gute M&#246;glichkeit zu lernen, unter welchen Bedingungen Pr&#252;fungen f&#252;r das Lernen funktionieren und wie diese effektiv in die bestehenden Curricula eingebettet werden k&#246;nnen. Dazu sollte in weiteren Studien das Ausma&#223; der Einzelma&#223;nahmen und deren Wechselwirkung untersucht werden. Dies ist eine gro&#223;e Herausforderung, da die Untersuchung realer Bedingungen in der medizinischen Ausbildung erschwert wird durch die vielen, h&#228;ufig unkontrollierbaren Bedingungen <TextLink reference="40"></TextLink>.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autor&#42;innen erkl&#228;ren, dass sie keinen Interessenkonflikt im Zusammenhang mit diesem Artikel haben.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Schuwirth LW</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefTitle>Programmatic assessment: From assessment of learning to assessment for learning</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>478-485</RefPage>
        <RefTotal>Schuwirth LW, van der Vleuten CP. Programmatic assessment: From assessment of learning to assessment for learning. Med Teach. 2011;33(6):478-485. DOI: 10.3109&#47;0142159X.2011.565828</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2011.565828</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Schuwirth LW</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefTitle>The use of progress testing</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Perspect Med Educ</RefJournal>
        <RefPage>24-30</RefPage>
        <RefTotal>Schuwirth LW, van der Vleuten CP. The use of progress testing. Perspect Med Educ. 2012;1(1):24-30. DOI: 10.1007&#47;s40037-012-0007-2</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s40037-012-0007-2</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Berkhout JJ</RefAuthor>
        <RefAuthor>Helmich E</RefAuthor>
        <RefAuthor>Teunissen PW</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefAuthor>Jaarsma AD</RefAuthor>
        <RefTitle>Context matters when striving to promote active and lifelong learning in medical education</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>34-44</RefPage>
        <RefTotal>Berkhout JJ, Helmich E, Teunissen PW, van der Vleuten CP, Jaarsma AD. Context matters when striving to promote active and lifelong learning in medical education. Med Educ. 2018;52(1):34-44. DOI: 10.1111&#47;medu.13463</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;medu.13463</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefTitle>The assessment of professional competence: Developments, research and practical implications</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>41-67</RefPage>
        <RefTotal>van der Vleuten CP. The assessment of professional competence: Developments, research and practical implications. Adv Health Sci Educ Theory Pract. 1996;1(1):41-67. DOI: 10.1007&#47;BF00596229</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;BF00596229</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Wade L</RefAuthor>
        <RefAuthor>Harrison C</RefAuthor>
        <RefAuthor>Hollands J</RefAuthor>
        <RefTitle>Student perceptions of the progress test in two settings and the implications for test deployment</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>573-583</RefPage>
        <RefTotal>Wade L, Harrison C, Hollands J. Student perceptions of the progress test in two settings and the implications for test deployment. Adv Health Sci Educ Theory Pract. 2012;17(4):573-583. DOI: 10.1007&#47;s10459-011-9334-z</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s10459-011-9334-z</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Cobb KA</RefAuthor>
        <RefAuthor>Brown G</RefAuthor>
        <RefAuthor>Jaarsma DA</RefAuthor>
        <RefAuthor>Hammond RA</RefAuthor>
        <RefTitle>The educational impact of assessment: a comparison of DOPS and MCQs</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>e1598-e1607</RefPage>
        <RefTotal>Cobb KA, Brown G, Jaarsma DA, Hammond RA. The educational impact of assessment: a comparison of DOPS and MCQs. Med Teach. 2013;35(11):e1598-e1607. DOI: 10.3109&#47;0142159X.2013.803061</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2013.803061</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>van Berkel HJ</RefAuthor>
        <RefAuthor>Nuy HJ</RefAuthor>
        <RefAuthor>Geerlings T</RefAuthor>
        <RefTitle>The influence of progress tests and block tests on study behaviour</RefTitle>
        <RefYear>1995</RefYear>
        <RefJournal>Instruct Sci</RefJournal>
        <RefPage>317-333</RefPage>
        <RefTotal>van Berkel HJ, Nuy HJ, Geerlings T. The influence of progress tests and block tests on study behaviour. Instruct Sci. 1995;22(4):317-333. DOI: 10.1007&#47;BF00891784</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;BF00891784</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Heeneman S</RefAuthor>
        <RefAuthor>Schut S</RefAuthor>
        <RefAuthor>Donkers J</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefAuthor>Muijtjens A</RefAuthor>
        <RefTitle>Embedding of the progress test in an assessment program designed according to the principles of programmatic assessment</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>44-52</RefPage>
        <RefTotal>Heeneman S, Schut S, Donkers J, van der Vleuten CP, Muijtjens A. Embedding of the progress test in an assessment program designed according to the principles of programmatic assessment. Med Teach. 2017;39(1):44-52. DOI: 10.1080&#47;0142159X.2016.1230183</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;0142159X.2016.1230183</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Wigfield A</RefAuthor>
        <RefAuthor>Eccles JS</RefAuthor>
        <RefTitle>Expectancy-value theory of achievement motivation</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Contemp Educ Psychol</RefJournal>
        <RefPage>68-81</RefPage>
        <RefTotal>Wigfield A, Eccles JS. Expectancy-value theory of achievement motivation. Contemp Educ Psychol. 2000;25(1):68-81. DOI: 10.1006&#47;ceps.1999.1015</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1006&#47;ceps.1999.1015</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Gast L</RefAuthor>
        <RefTitle>&#34;Kein Ort. Nirgends&#63;&#34; Das Subjekt der Erkenntnis und die Idee der Universit&#228;t. Einige Gedanken aus psychoanalytischer Perspektive</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Psychol Gesellschaftskritik</RefJournal>
        <RefPage>153-171</RefPage>
        <RefTotal>Gast L. &#34;Kein Ort. Nirgends&#63;&#34; Das Subjekt der Erkenntnis und die Idee der Universit&#228;t. Einige Gedanken aus psychoanalytischer Perspektive. Psychol Gesellschaftskritik. 2010;33&#47;34(4&#47;1):153-171.</RefTotal>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Zeigarnik BV</RefAuthor>
        <RefTitle>Das Behalten erledigter und unerledigter Handlungen</RefTitle>
        <RefYear>1927</RefYear>
        <RefJournal>Psychol Forsch</RefJournal>
        <RefPage>1-85</RefPage>
        <RefTotal>Zeigarnik BV. Das Behalten erledigter und unerledigter Handlungen. Psychol Forsch. 1927;9:1-85.</RefTotal>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Albano MG</RefAuthor>
        <RefAuthor>Cavallo F</RefAuthor>
        <RefAuthor>Hoogenboom R</RefAuthor>
        <RefAuthor>Magni F</RefAuthor>
        <RefAuthor>Majoor G</RefAuthor>
        <RefAuthor>Manenti F</RefAuthor>
        <RefAuthor>Schuwirth L</RefAuthor>
        <RefAuthor>Stiegler I</RefAuthor>
        <RefAuthor>van der Vleuten C</RefAuthor>
        <RefTitle>An international comparison of knowledge levels of medical students: the Maastricht Progress Test</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>239-45</RefPage>
        <RefTotal>Albano MG, Cavallo F, Hoogenboom R, Magni F, Majoor G, Manenti F, Schuwirth L, Stiegler I, van der Vleuten C. An international comparison of knowledge levels of medical students: the Maastricht Progress Test. Med Educ. 1996;30(4):239-45. DOI: 10.1111&#47;j.1365-2923.1996.tb00824.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.1996.tb00824.x</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefAuthor>Verwijnen GM</RefAuthor>
        <RefAuthor>Wijnen WH</RefAuthor>
        <RefTitle>Fifteen years of experience with progress testing in a problem-based learning curriculum</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>103-109</RefPage>
        <RefTotal>van der Vleuten CP, Verwijnen GM, Wijnen WH. Fifteen years of experience with progress testing in a problem-based learning curriculum. Med Teach. 1996;18(2):103-109. DOI: 10.3109&#47;01421599609034142</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;01421599609034142</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Nouns ZM</RefAuthor>
        <RefAuthor>Georg W</RefAuthor>
        <RefTitle>Progress testing in German-speaking countries</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>467-470</RefPage>
        <RefTotal>Nouns ZM, Georg W. Progress testing in German-speaking countries. Med Teach. 2010;32(6):467-470. DOI: 10.3109&#47;0142159X.2010.485656</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2010.485656</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Osterberg K</RefAuthor>
        <RefAuthor>K&#246;lbel S</RefAuthor>
        <RefAuthor>Brauns</RefAuthor>
        <RefAuthor>K</RefAuthor>
        <RefTitle>Der Progress Test Medizin: Erfahrungen an der Charit&#233; Berlin</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefPage>Doc46</RefPage>
        <RefTotal>Osterberg K, K&#246;lbel S, Brauns, K. Der Progress Test Medizin: Erfahrungen an der Charit&#233; Berlin. GMS Z Med Ausbild. 2006;23(3):Doc46. Zug&#228;nglich unter&#47;available from: https:&#47;&#47;www.egms.de&#47;static&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000265.shtml</RefTotal>
        <RefLink>https:&#47;&#47;www.egms.de&#47;static&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000265.shtml</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Ryan RM</RefAuthor>
        <RefAuthor>Deci EL</RefAuthor>
        <RefTitle>Intrinsic and extrinsic motivations: Classic definitions and new directions</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Cont Educ Psychol</RefJournal>
        <RefPage>54-67</RefPage>
        <RefTotal>Ryan RM, Deci EL. Intrinsic and extrinsic motivations: Classic definitions and new directions. Cont Educ Psychol. 2000;25:54-67. DOI: 10.1006&#47;ceps.1999.1020</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1006&#47;ceps.1999.1020</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Hackman JR</RefAuthor>
        <RefAuthor>Oldham GR</RefAuthor>
        <RefTitle>Motivation through the design of work: Test of a theory</RefTitle>
        <RefYear>1976</RefYear>
        <RefJournal>Organ Behav Hum Perform</RefJournal>
        <RefPage>250-279</RefPage>
        <RefTotal>Hackman JR, Oldham GR. Motivation through the design of work: Test of a theory. Organ Behav Hum Perform. 1976;16(2):250-279. DOI: 10.1016&#47;0030-5073(76)90016-7</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;0030-5073(76)90016-7</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Kulik JA</RefAuthor>
        <RefAuthor>Kulik CLC</RefAuthor>
        <RefTitle>Timing of feedback and verbal learning</RefTitle>
        <RefYear>1988</RefYear>
        <RefJournal>Rev Educ Res</RefJournal>
        <RefPage>79-97</RefPage>
        <RefTotal>Kulik JA, Kulik CLC. Timing of feedback and verbal learning. Rev Educ Res. 1988;58(1):79-97. DOI: 10.3102&#47;00346543058001079</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3102&#47;00346543058001079</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Tuten TL</RefAuthor>
        <RefAuthor>Galesic M</RefAuthor>
        <RefAuthor>Bosnjak M</RefAuthor>
        <RefTitle>Effects of immediate versus delayed notification of prize draw results and announced survey duration on response behavior in web surveys: An experiment</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Soc Sci Comput Rev</RefJournal>
        <RefPage>377-384</RefPage>
        <RefTotal>Tuten TL, Galesic M, Bosnjak M. Effects of immediate versus delayed notification of prize draw results and announced survey duration on response behavior in web surveys: An experiment. Soc Sci Comput Rev. 2004;22(3):377-384. DOI: 10.1177&#47;0894439304265640</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1177&#47;0894439304265640</RefLink>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Irons A</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Enhancing learning through formative assessment and feedback</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Irons A. Enhancing learning through formative assessment and feedback. London: Routledge Taylor &#38; Francis Group; 2008. DOI: 10.4324&#47;9780203934333</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.4324&#47;9780203934333</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Nicol D</RefAuthor>
        <RefAuthor>Macfarlane-Dick D</RefAuthor>
        <RefTitle>Formative assessment and self-regulated learning: a model and seven principles of good feedback practice</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Stud High Educ</RefJournal>
        <RefPage>199-218</RefPage>
        <RefTotal>Nicol D, Macfarlane-Dick D. Formative assessment and self-regulated learning: a model and seven principles of good feedback practice. Stud High Educ. 2006;31(2):199-218. DOI: 10.1080&#47;03075070600572090</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;03075070600572090</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Smyth K</RefAuthor>
        <RefTitle>The benefits of students learning about critical evaluation rather than being summatively judged</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Ass Eval High Educ</RefJournal>
        <RefPage>369-377</RefPage>
        <RefTotal>Smyth K. The benefits of students learning about critical evaluation rather than being summatively judged. Ass Eval High Educ. 2004;29(3):369-377. DOI: 10.1080&#47;0260293042000197609</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;0260293042000197609</RefLink>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Sch&#252;ttpelz-Brauns K</RefAuthor>
        <RefAuthor>Kadmon M</RefAuthor>
        <RefAuthor>Kiessling C</RefAuthor>
        <RefAuthor>Karay Y</RefAuthor>
        <RefAuthor>Gestmann M</RefAuthor>
        <RefAuthor>K&#228;mmer JE</RefAuthor>
        <RefTitle>Identifying low test-taking effort during low-stakes tests with the new Test-taking Effort Short Scale (TESS) - Development and Psychometrics</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>101</RefPage>
        <RefTotal>Sch&#252;ttpelz-Brauns K, Kadmon M, Kiessling C, Karay Y, Gestmann M, K&#228;mmer JE. Identifying low test-taking effort during low-stakes tests with the new Test-taking Effort Short Scale (TESS) - Development and Psychometrics. BMC Med Educ. 2018;18(1):101. DOI: 10.1186&#47;s12909-018-1196-0</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-018-1196-0</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>Brauns K</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Identifikation von Musterkreuzern beim Progress Test Medizin</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Brauns K. Identifikation von Musterkreuzern beim Progress Test Medizin. &#91;Dissertation&#93;. Berlin: Humboldt-Universit&#228;t zu Berlin; 2007.</RefTotal>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Cohen J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1988</RefYear>
        <RefBookTitle>Statistical power analysis for the behavioral sciences</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Cohen J. Statistical power analysis for the behavioral sciences. Hillsdale: Erlbaum; 1988.</RefTotal>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Leonhart R</RefAuthor>
        <RefTitle>Effektgr&#246;&#223;enberechnung bei Interventionsstudien</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Reha</RefJournal>
        <RefPage>241-246</RefPage>
        <RefTotal>Leonhart R. Effektgr&#246;&#223;enberechnung bei Interventionsstudien. Reha. 2004;43:241-246. DOI: 10.1055&#47;s-2004-828293</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1055&#47;s-2004-828293</RefLink>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Mayring P</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Qualitative Inhaltsanalyse - Grundlagen und Techniken</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Mayring P. Qualitative Inhaltsanalyse - Grundlagen und Techniken. 11. Auflage. Weinheim, Basel: Beltz Verlag; 2008.</RefTotal>
      </Reference>
      <Reference refNo="28">
        <RefAuthor>Karay Y</RefAuthor>
        <RefAuthor>Schauber SK</RefAuthor>
        <RefAuthor>Stosch C</RefAuthor>
        <RefAuthor>Schuettpelz-Brauns K</RefAuthor>
        <RefTitle>Can computer-based assessment enhance the acceptance of formative multiple choice exams&#63; A utility analysis</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>292-296</RefPage>
        <RefTotal>Karay Y, Schauber SK, Stosch C, Schuettpelz-Brauns K. Can computer-based assessment enhance the acceptance of formative multiple choice exams&#63; A utility analysis. Med Teach. 2012;34:292-296. DOI: 10.3109&#47;0142159X.2012.652707</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2012.652707</RefLink>
      </Reference>
      <Reference refNo="29">
        <RefAuthor>Flake JK</RefAuthor>
        <RefAuthor>Barron KE</RefAuthor>
        <RefAuthor>Hulleman C</RefAuthor>
        <RefAuthor>McCoach BD</RefAuthor>
        <RefAuthor>Welsh ME</RefAuthor>
        <RefTitle>Measuring cost: The forgotten component of expectancy-value theory</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>Contemp Educ Psychol</RefJournal>
        <RefPage>232-244</RefPage>
        <RefTotal>Flake JK, Barron KE, Hulleman C, McCoach BD, Welsh ME. Measuring cost: The forgotten component of expectancy-value theory. Contemp Educ Psychol. 2015;41:232-244. DOI: 10.1016&#47;j.cedpsych.2015.03.002</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.cedpsych.2015.03.002</RefLink>
      </Reference>
      <Reference refNo="30">
        <RefAuthor>Blake J</RefAuthor>
        <RefAuthor>Norman GR</RefAuthor>
        <RefAuthor>Keane DR</RefAuthor>
        <RefAuthor>Mueller B</RefAuthor>
        <RefAuthor>Cunnington J</RefAuthor>
        <RefAuthor>Didyk N</RefAuthor>
        <RefTitle>Introducing progress testing in McMaster University&#39;s problem-based medical curriculum: Psychometric properties and effect on learning</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>1002-1007</RefPage>
        <RefTotal>Blake J, Norman GR, Keane DR, Mueller B, Cunnington J, Didyk N. Introducing progress testing in McMaster University&#39;s problem-based medical curriculum: Psychometric properties and effect on learning. Acad Med. 1996;71(9):1002-1007. DOI: 10.1097&#47;00001888-199609000-00016</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;00001888-199609000-00016</RefLink>
      </Reference>
      <Reference refNo="31">
        <RefAuthor>Aarts R</RefAuthor>
        <RefAuthor>Steidel K</RefAuthor>
        <RefAuthor>Manuel BAF</RefAuthor>
        <RefAuthor>Driessen EW</RefAuthor>
        <RefTitle>Progress testing resource-poor countries: A case from Mozambique</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>461-463</RefPage>
        <RefTotal>Aarts R, Steidel K, Manuel BAF, Driessen EW. Progress testing resource-poor countries: A case from Mozambique. Med Teach. 2010;32(6):461-463. DOI: 10.3109&#47;0142159X.2010.486059</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2010.486059</RefLink>
      </Reference>
      <Reference refNo="32">
        <RefAuthor>Given K</RefAuthor>
        <RefAuthor>Hannigan A</RefAuthor>
        <RefAuthor>McGrath D</RefAuthor>
        <RefTitle>Red, yellow and green: What does it mean&#63; How the progress test informs and supports student progress</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>1025-1032</RefPage>
        <RefTotal>Given K, Hannigan A, McGrath D. Red, yellow and green: What does it mean&#63; How the progress test informs and supports student progress. Med Teach. 2016;38(10):1025-1032. DOI: 10.3109&#47;0142159X.2016.1147533</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2016.1147533</RefLink>
      </Reference>
      <Reference refNo="33">
        <RefAuthor>Yielder J</RefAuthor>
        <RefAuthor>Wearn A</RefAuthor>
        <RefAuthor>Chen Y</RefAuthor>
        <RefAuthor>Henning M</RefAuthor>
        <RefAuthor>Weller J</RefAuthor>
        <RefAuthor>Lillis S</RefAuthor>
        <RefAuthor>Mogol V</RefAuthor>
        <RefAuthor>Bagg W</RefAuthor>
        <RefTitle>A qualitative exploration of student perceptions of the impact of progress tests on learning and emotional wellbeing</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>148</RefPage>
        <RefTotal>Yielder J, Wearn A, Chen Y, Henning M, Weller J, Lillis S, Mogol V, Bagg W. A qualitative exploration of student perceptions of the impact of progress tests on learning and emotional wellbeing. BMC Med Educ. 2017;17(1):148. DOI: 10.1186&#47;s12909-017-0984-2</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-017-0984-2</RefLink>
      </Reference>
      <Reference refNo="34">
        <RefAuthor>Nouns ZM</RefAuthor>
        <RefAuthor>Schauber S</RefAuthor>
        <RefAuthor>Witt C</RefAuthor>
        <RefAuthor>Kingreen H</RefAuthor>
        <RefAuthor>Sch&#252;ttpelz-Brauns K</RefAuthor>
        <RefTitle>Development of knowledge in basic medical sciences during undergraduate medical education &#8211; A comparison of a traditional and a problem-based curriculum</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>1206-1214</RefPage>
        <RefTotal>Nouns ZM, Schauber S, Witt C, Kingreen H, Sch&#252;ttpelz-Brauns K. Development of knowledge in basic medical sciences during undergraduate medical education &#8211; A comparison of a traditional and a problem-based curriculum. Med Educ. 2012;46(12):1206-1214. DOI: 10.1111&#47;medu.12047</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;medu.12047</RefLink>
      </Reference>
      <Reference refNo="35">
        <RefAuthor>Coelho C</RefAuthor>
        <RefAuthor>Zahra D</RefAuthor>
        <RefAuthor>Ali K</RefAuthor>
        <RefAuthor>Tredwin C</RefAuthor>
        <RefTitle>To accept or decline academic remediation: What difference does it make&#63;</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>824-829</RefPage>
        <RefTotal>Coelho C, Zahra D, Ali K, Tredwin C. To accept or decline academic remediation: What difference does it make&#63; Med Teach. 2019;41(7):824-829. DOI: 10.1080&#47;0142159X.2019.1585789</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;0142159X.2019.1585789</RefLink>
      </Reference>
      <Reference refNo="36">
        <RefAuthor>Lillis S</RefAuthor>
        <RefAuthor>Yielder J</RefAuthor>
        <RefAuthor>Mogol V</RefAuthor>
        <RefAuthor>O&#39;Connor B</RefAuthor>
        <RefAuthor>Bacal K</RefAuthor>
        <RefAuthor>Booth R</RefAuthor>
        <RefAuthor>Bagg W</RefAuthor>
        <RefTitle>Progress testing for medical students at the University of Auckland: Results from the first year of assessments</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>J Med Educ Curr Dev</RefJournal>
        <RefPage>41-45</RefPage>
        <RefTotal>Lillis S, Yielder J, Mogol V, O&#39;Connor B, Bacal K, Booth R, Bagg W. Progress testing for medical students at the University of Auckland: Results from the first year of assessments. J Med Educ Curr Dev. 2014;1:41-45. DOI: 10.4137&#47;JMECD.S20094</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.4137&#47;JMECD.S20094</RefLink>
      </Reference>
      <Reference refNo="37">
        <RefAuthor>Norman G</RefAuthor>
        <RefAuthor>Neville A</RefAuthor>
        <RefAuthor>Blake J</RefAuthor>
        <RefAuthor>Mueller B</RefAuthor>
        <RefTitle>Assessment steers learning down the right road: impact of progress testing on licensing examination performance</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>496-499</RefPage>
        <RefTotal>Norman G, Neville A, Blake J, Mueller B. Assessment steers learning down the right road: impact of progress testing on licensing examination performance. Med Teach. 2010;32(6):496-499. DOI: 10.3109&#47;0142159X.2010.486063</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2010.486063</RefLink>
      </Reference>
      <Reference refNo="38">
        <RefAuthor>Kastenmeier AS</RefAuthor>
        <RefAuthor>Redlich PN</RefAuthor>
        <RefAuthor>Fihn C</RefAuthor>
        <RefAuthor>Treat R</RefAuthor>
        <RefAuthor>Chou R</RefAuthor>
        <RefAuthor>Homel A</RefAuthor>
        <RefAuthor>Lewis BD</RefAuthor>
        <RefTitle>Individual learning plans foster self-directed learning skills and contribute to improved educational outcomes in the surgery clerkship</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Am J Surg</RefJournal>
        <RefPage>160-166</RefPage>
        <RefTotal>Kastenmeier AS, Redlich PN, Fihn C, Treat R, Chou R, Homel A, Lewis BD. Individual learning plans foster self-directed learning skills and contribute to improved educational outcomes in the surgery clerkship. Am J Surg. 2018;216(1):160-166. DOI: 10.1016&#47;j.amjsurg.2018.01.023</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.amjsurg.2018.01.023</RefLink>
      </Reference>
      <Reference refNo="39">
        <RefAuthor>Schuwirth LW</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefTitle>Current assessment in medical education: Programmatic assessment</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>J Appl Test Technol</RefJournal>
        <RefPage>2-10</RefPage>
        <RefTotal>Schuwirth LW, van der Vleuten CP. Current assessment in medical education: Programmatic assessment. J Appl Test Technol. 2019;20(S2):2-10.</RefTotal>
      </Reference>
      <Reference refNo="40">
        <RefAuthor>Ringsted C</RefAuthor>
        <RefAuthor>Hodges B</RefAuthor>
        <RefAuthor>Scherpbier A</RefAuthor>
        <RefTitle>&#39;The research compass&#39;: An introduction to research in medical education: AMEE Guide No. 56</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>695-709</RefPage>
        <RefTotal>Ringsted C, Hodges B, Scherpbier A. &#39;The research compass&#39;: An introduction to research in medical education: AMEE Guide No. 56, Med Teach. 2011;33(9):695-709. DOI: 10.3109&#47;0142159X.2011.595436</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2011.595436</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 1: Conditions of undergraduate training, assessment and feedback at the two faculties</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Studien-, Pr&#252;fungs- und Feedbackbedingungen an den beiden Fakult&#228;ten</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 2: Participants in the BPT survey</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Teilnehmende an der Befragung zum PTM</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="en">3en</MediaID>
          <MediaID language="de">3de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 3: Categorisation of the responses to the open question &#8220;Do you feel emotionally restricted by the BPT&#63; In what way&#63;&#8221;</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 3: Kategorisierung der Nennungen auf die offene Frage &#8222;F&#252;hlen Sie sich emotional durch den PTM eingeschr&#228;nkt&#63; Inwiefern&#63;&#8220;</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>4</MediaNo>
          <MediaID language="en">4en</MediaID>
          <MediaID language="de">4de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 4: Categorisation of the responses to the open question &#8220;What disadvantages do you see in the BPT&#63;&#8221;</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 4: Kategorisierung der Nennungen auf die offene Frage &#8222;Welche Nachteile sehen Sie beim PTM&#63;&#8220;</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>5</MediaNo>
          <MediaID language="en">5en</MediaID>
          <MediaID language="de">5de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 5: Dialogue with other people about the results of the BPT</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 5: Dialog mit anderen Personen &#252;ber die Ergebnisse beim PTM</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>6</MediaNo>
          <MediaID language="en">6en</MediaID>
          <MediaID language="de">6de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 6: Categorisation of the responses to the open question &#8220;Do you use the results of the BPT for other purposes&#63; If so, how&#63;&#8221;</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 6: Kategorisierung der Nennungen auf die offene Frage &#8222;Nutzen Sie die Ergebnisse des PTM noch anderweitig&#63; Wenn ja, wie&#63;&#8220;</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>7</MediaNo>
          <MediaID language="en">7en</MediaID>
          <MediaID language="de">7de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 7: Categorisation of the responses to the open question &#8220;What advantages do you see in the BPT&#63;&#8221;</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 7: Kategorisierung der Nennungen auf die offene Frage &#8222;Welche Vorteile sehen Sie beim PTM&#63;&#8220;</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>7</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>