<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma000981</Identifier>
    <IdentifierDoi>10.3205/zma000981</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0009816</IdentifierUrn>
    <ArticleType language="en">article</ArticleType>
    <ArticleType language="de">Artikel</ArticleType>
    <TitleGroup>
      <Title language="en">The Final Oral&#47;Practical State Examination at Freiburg Medical Faculty in 2012 &#8211; Analysis of grading to test quality assurance</Title>
      <TitleTranslated language="de">M&#252;ndlich-praktischer Teil des Zweiten Abschnitts der &#196;rztlichen Pr&#252;fung in Freiburg 2012 &#8211; Analyse der Notenvergabe zur &#220;berpr&#252;fung von Qualit&#228;tssicherungsma&#223;nahmen</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Schickler</Lastname>
          <LastnameHeading>Schickler</LastnameHeading>
          <Firstname>Angela</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Uni Freiburg, Kompetenzzentrum Lehrevaluation in der Medizin Baden-W&#252;rttemberg, Sitz Freiburg, Freiburg, Deutschland</Affiliation>
        </Address>
        <Email>angela.schickler&#64;uniklinik-freiburg.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Br&#252;stle</Lastname>
          <LastnameHeading>Br&#252;stle</LastnameHeading>
          <Firstname>Peter</Firstname>
          <Initials>P</Initials>
        </PersonNames>
        <Address>Uni Freiburg, Kompetenzzentrum Lehrevaluation in der Medizin Baden-W&#252;rttemberg, Sitz Freiburg, Freiburg, Deutschland<Affiliation>Uni Freiburg, Kompetenzzentrum Lehrevaluation in der Medizin Baden-W&#252;rttemberg, Sitz Freiburg, Freiburg, Deutschland</Affiliation></Address>
        <Email>peter.bruestle&#64;uniklinik-freiburg.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Biller</Lastname>
          <LastnameHeading>Biller</LastnameHeading>
          <Firstname>Silke</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address>Uni Freiburg, Kompetenzzentrum Lehrevaluation in der Medizin Baden-W&#252;rttemberg, Sitz Freiburg, Freiburg, Deutschland<Affiliation>Uni Freiburg, Kompetenzzentrum Lehrevaluation in der Medizin Baden-W&#252;rttemberg, Sitz Freiburg, Freiburg, Deutschland</Affiliation></Address>
        <Email>silke.biller&#64;uniklinik-freiburg.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">German State Examination</Keyword>
      <Keyword language="en">oral and practical part of the state examination</Keyword>
      <Keyword language="en">training of examiners</Keyword>
      <Keyword language="en">grading</Keyword>
      <Keyword language="de">Staatsexamen Medizin</Keyword>
      <Keyword language="de">m&#252;ndlich-praktische M2-Pr&#252;fung</Keyword>
      <Keyword language="de">Pr&#252;ferworkshop</Keyword>
      <Keyword language="de">Notengebung</Keyword>
      <SectionHeading language="en">Assessment</SectionHeading>
      <SectionHeading language="de">Pr&#252;fungen</SectionHeading>
    </SubjectGroup>
    <DateReceived>20140114</DateReceived>
    <DateRevised>20141023</DateRevised>
    <DateAccepted>20150105</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20151015</DatePublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>1860-3572</ISSN>
        <Volume>32</Volume>
        <Issue>4</Issue>
        <JournalTitle>GMS Zeitschrift f&#252;r Medizinische Ausbildung</JournalTitle>
        <JournalTitleAbbr>GMS Z Med Ausbild</JournalTitleAbbr>
        <IssueTitle>Pr&#252;fungen</IssueTitle>
      </Journal>
    </SourceGroup>
    <ArticleNo>39</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Zielsetzung: </Mark1>Von der Medizinischen Fakult&#228;t Freiburg werden verschiedene Ma&#223;nahmen zur Qualit&#228;tssicherung des m&#252;ndlich-praktischen Teils des Zweiten Abschnitts der &#196;rztlichen Pr&#252;fung (M2) betrieben. Insbesondere werden die Pr&#252;fenden in einem Baden-W&#252;rttemberg-weit standardisierten M2-Pr&#252;ferworkshop fortgebildet.</Pgraph><Pgraph>Ziel der vorliegenden Studie war es die Notenvergabe zu analysieren. Es wurde gepr&#252;ft, welcher Zusammenhang zwischen der schriftlichen und der m&#252;ndlich-praktischen Notenvergabe besteht und ob sich ein Unterschied in der Notenvergabe zwischen Universit&#228;tsklinikum (UKL) und den Akademischen Lehrkrankenh&#228;usern (ALKs) findet. Dar&#252;ber hinaus wurde untersucht, ob sich die Notenvergabe von fortgebildeten und nicht fortgebildeten Pr&#252;fenden unterscheidet und inwieweit diese Unterschiede sich im zeitlichen Abstand zum Workshop ver&#228;ndern. </Pgraph><Pgraph><Mark1>Methodik: </Mark1>Die analysierte Stichprobe (N&#61;315) umfasst die Fr&#252;hjahrs- und Herbstpr&#252;fungskohorte 2012. Der Datensatz wurde vom Landespr&#252;fungsamt zur Verf&#252;gung gestellt und mittels deskriptiver und Inferenzstatistik ausgewertet.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Zwischen der schriftlichen und m&#252;ndlich-praktischen M2-Pr&#252;fungsnote konnte ein Zusammenhang von &#961;&#61;0,460&#42;&#42; ermittelt werden. Es konnte kein signifikanter Unterschied in der Verteilung der Noten zwischen UKL und den ALKs festgestellt werden. Die Daten zu den Variablen fortgebildete versus nicht fortgebildete Pr&#252;fende zeigen, dass Pr&#252;fende mit Absolvierung eines Pr&#252;ferworkshops seltener die Note &#8222;sehr gut&#8220; sowie ein breiteres Notenspektrum vergeben. In der Verteilung der Noten zeigt sich ein signifikanter Unterschied (p&#61;0,007, phi&#61;0,165). Dieses Ergebnis wird deutlicher bei Betrachtung von Pr&#252;fenden, deren Workshopteilnahme nicht l&#228;nger als ein Jahr zur&#252;cklag. </Pgraph><Pgraph><Mark1>Schlussfolgerungen: </Mark1>Die Ergebnisse der Analyse weisen darauf hin, dass der Pr&#252;ferworkshop an der Medizinischen Fakult&#228;t Freiburg eine wirksame Qualit&#228;tssicherungsma&#223;nahme ist. Die Ergebnisse lassen den Schluss zu, die Pr&#252;fenden zur Absolvierung eines Pr&#252;ferworkshops zu motivieren.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Aim: </Mark1>The aim of this study is to analyze the grades given for the oral&#47;practical part of the German State Examination at the Medical Faculty of Freiburg. We examined whether or not the grades given for the written and the oral&#47;practical examinations correlated and if differences in grading between the Freiburg University Medical Center (UMC) and the other teaching hospitals could be found.</Pgraph><Pgraph>In order to improve the quality of the state examination, the medical school has been offering standardized training for examiners for several years. We evaluated whether or not trained and untrained examiners differed in their grading of the exam and how these differences have changed over time.</Pgraph><Pgraph><Mark1>Methods:</Mark1> The results of the 2012 spring and fall exams were analyzed (N&#61;315). The relevant data set was made available to us by the Baden-W&#252;rttemberg Examination Office (<Mark2>Landespr&#252;fungsamt</Mark2>). The data were analyzed by means of descriptive and inferential statistics.</Pgraph><Pgraph><Mark1>Results: </Mark1>We observed a correlation of &#961;&#61;0.460&#42;&#42; between the grades for the written and the oral&#47;practical exams. The UMC and the teaching hospitals did not differ significantly in their grade distributions. Compared to untrained examiners, trained ones assigned the grade of &#8220;very good&#8221; less often. Furthermore, they displayed a significantly higher variance in the grades given (p&#61;0.007, phi&#61;0.165). This effect is stronger when concentrating specifically on those examiners who took part in the training less than a year before.</Pgraph><Pgraph><Mark1>Conclusion: </Mark1>The results of this study suggest that the standardized training for examiners at the Medical Faculty of Freiburg is effective for quality assurance. As a consequence, more examiners should be motivated to take part in the training.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="Background">
      <MainHeadline>Background</MainHeadline><Pgraph>The 2002 medical licensing regulations (<Mark2>&#196;rztliche Approbationsordnung</Mark2>) <TextLink reference="1"></TextLink> led to fundamental changes in the German State Examination, which then consisted of two sections until the current changes in 2012. The first section (M1) was taken by students after the first two years of study; the second one (M2) following the entire course of study, including the final practical year. Both sections are divided into a written and an oral&#47;practical part. Some of the changes in 2002 affected the oral&#47;practical part of the M2: its score represents one-third of the student&#8217;s final overall grade. The length of the test was extended to two full days and a practical section was explicitly introduced. A total of four to five examiners administer the examination to a maximum of four examinees <TextLink reference="1"></TextLink>. It is required that the focus of this examination be on patient-oriented questions <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.</Pgraph><Pgraph>In general, the oral&#47;practical M2 examination is a very extensive, professionally qualifying exam that places considerable demands on the examiners. In a 2011 resolution, the<Mark2> Medizinische Fakult&#228;tentag</Mark2> (MFT) made reference to the great burden placed on the medical schools. It raised concern that through this increased use of resources and the necessary expansion of the examiner pool to include people from outside the universities, a decrease in exam quality and unequal treatment of the candidates could possibly result &#91;<Hyperlink href="http:&#47;&#47;www.mft-online.de&#47;files&#47;200&#95;omft&#95;2011.pdf">http:&#47;&#47;www.mft-online.de&#47;files&#47;200&#95;omft&#95;2011.pdf</Hyperlink> most recently verified on 5 Nov. 2013&#93;. To train final-year medical students, the Medical Faculty of Freiburg cooperates with 15 teaching hospitals, which are also involved in the oral&#47;practical M2 examinations. In order to create uniform and comparable testing practices among all of the teaching hospitals, at least one member of the university teaching staff co-administers the examinations at the teaching hospitals.</Pgraph><Pgraph>The scores assigned during the examinations should allow conclusions to be drawn about the competencies of the exam candidates. For this to be the case, grading must be based on fairness and equal opportunity, while also having the ability to stand up in court of law <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>, <TextLink reference="6"></TextLink>. To ensure this, it is critical that a test&#8217;s strengths and weaknesses are handled with awareness, consistent testing conditions and practices are ensured, content and expectations are competently structured and standardized, and the most objective evaluation criteria possible are applied <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>. Doing justice to the requirements for quality criteria &#8211; objectivity, reliability and validity &#8211; is a known challenge facing oral and practical examinations <TextLink reference="6"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>, <TextLink reference="12"></TextLink>.</Pgraph><Pgraph>An effective measure to increase the quality, and with it the quality of practical and oral exams, are training programs for examiners <TextLink reference="4"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. During training, strategies are imparted that can optimize not only the administration of tests, but also the evaluation of test performance <TextLink reference="6"></TextLink>.</Pgraph><Pgraph>In Baden-W&#252;rttemberg a workshop for M2 examiners was designed in 2007 by the Competency Network for Teaching in Medicine (<Mark2>Kompetenznetz &#8220;Lehre in der Medizin&#8221;</Mark2>) <TextLink reference="14"></TextLink> and is regularly held at all the medical schools in Baden-W&#252;rttemberg to prepare examiners for the oral&#47;practical part of the exam. This workshop consists of eight instructional units divided into seminar sessions and practical exercises and pursues the objectives of creating smooth testing procedures, optimizing tests based on experience, formulating test questions and tasks, and establishing criteria-based grading <TextLink reference="7"></TextLink>.</Pgraph><Pgraph>In a study by &#214;chsner, Geiler &#38; Huber-Lang, examiners trained in the M2 workshops conducted at the Medical Faculty of Ulm were retrospectively surveyed about the effects and sustainability of the workshop using self-evaluation questionnaires <TextLink reference="7"></TextLink>. The examiners were asked about the core issues of responding to strengths and weaknesses in the M2 exam with awareness, knowledge regarding the influence of reliability and validity on the oral&#47;practical exam, confidence in designing test questions and following formal rules and regulations, and implementing a structured oral examination. The responses to all of the core issues pointed to benefits resulting from the examiner workshop, and these could be detected in the examiners even two years after completing the workshop. In close relation to the examiner perspectives presented in this study, our analysis here focuses on the output &#8211; the assignment of grades &#8211; at the Medical Faculty of Freiburg.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Hintergrund">
      <MainHeadline>Hintergrund</MainHeadline><Pgraph>In der &#196;rztlichen Approbationsordnung von 2002 <TextLink reference="1"></TextLink> kam es zu grundlegenden &#196;nderungen des Staatsexamens. So bestand dieses bis zu den aktuellen &#196;nderungen von 2012 aus zwei Abschnitten. Der erste Abschnitt (M1) wurde nach den ersten beiden Studienjahren abgelegt, der zweite Abschnitt (M2) nach dem gesamten Studium inklusive des Praktischen Jahres (PJ). Beide Pr&#252;fungsabschnitte unterteilten sich in einen schriftlichen und einen m&#252;ndlich-praktischen Teil. Einige der &#196;nderungen von 2002 betrafen den m&#252;ndlich-praktischen Teil des M2: Die m&#252;ndlich-praktische M2-Pr&#252;fungsnote wiegt in der Abschlussgesamtnote der Studierenden ein Drittel. Die Pr&#252;fungszeit wurde auf zwei ganze Tage verl&#228;ngert und ein praktischer Pr&#252;fungsanteil wurde explizit eingef&#252;hrt. Insgesamt f&#252;hren vier bis f&#252;nf Pr&#252;fende die Pr&#252;fung von maximal vier Pr&#252;flingen durch <TextLink reference="1"></TextLink>. Es wird gefordert, den Schwerpunkt dieser Pr&#252;fung auf patientenbezogene Fragestellungen zu legen <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.</Pgraph><Pgraph>Grunds&#228;tzlich handelt es sich bei der m&#252;ndlich-praktischen M2-Pr&#252;fung um eine sehr aufwendige berufsqualifizierende Pr&#252;fung, welche f&#252;r die Pr&#252;fenden mit erheblichen Anforderungen verbunden ist. Der Medizinische Fakult&#228;tentag (MFT) hat 2011 in einer Resolution auf die hohe Belastung der Medizinischen Fakult&#228;ten hingewiesen. Er gab zu bedenken, dass durch diesen erh&#246;hten Ressourceneinsatz und die dadurch notwendige Ausweitung des Pools an Pr&#252;fenden auch auf Personal au&#223;erhalb der Universit&#228;ten ein Qualit&#228;tsverlust der Pr&#252;fungen und eine Ungleichbehandlung der Pr&#252;flinge m&#246;glich seien &#91;<Hyperlink href="http:&#47;&#47;www.mft-online.de&#47;files&#47;200&#95;omft&#95;2011.pdf">http:&#47;&#47;www.mft-online.de&#47;files&#47;200&#95;omft&#95;2011.pdf</Hyperlink> zuletzt gepr&#252;ft am 05.11.2013&#93;. Die Medizinische Fakult&#228;t Freiburg arbeitet bei der Ausbildung der PJ-Studierenden mit 15 Akademischen Lehrkrankenh&#228;usern (ALKs) zusammen, welche auch an den m&#252;ndlich-praktischen M2-Pr&#252;fungen beteiligt sind. Um zwischen allen Ausbildungskrankenh&#228;usern eine einheitliche und gleichwertige Pr&#252;fungspraxis herzustellen, nimmt mindestens eine Person des universit&#228;ren Lehrk&#246;rpers die Pr&#252;fungen an den ALKs mit ab.</Pgraph><Pgraph>Die bei der Pr&#252;fung vergebenen Noten sollen R&#252;ckschl&#252;sse auf die Kompetenzen der Pr&#252;fungskandidierenden zulassen. Dazu muss die Notenvergabe auf Fairness und Chancengleichheit basieren, aber auch Gerichtsfestigkeit aufweisen <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>, <TextLink reference="6"></TextLink>. Um dies zu gew&#228;hrleisten, sind ein bewusster Umgang mit den St&#228;rken und Schw&#228;chen der Pr&#252;fung, Konstanz in den Pr&#252;fungsbedingungen und der Pr&#252;fungspraxis, eine gute Strukturierung und Standardisierung der Inhalte sowie Erwartungshorizonte und m&#246;glichst objektive Bewertungskriterien f&#252;r die Pr&#252;fung notwendig <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>. Den Anforderungen an die G&#252;tekriterien &#8211; Objektivit&#228;t, Reliabilit&#228;t und Validit&#228;t &#8211; gerecht zu werden ist bei m&#252;ndlich-praktischen Pr&#252;fungen ein bekanntes Problem <TextLink reference="6"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>, <TextLink reference="12"></TextLink>.</Pgraph><Pgraph>Eine wirksame Ma&#223;nahme um die G&#252;te und damit einhergehend die Qualit&#228;t von m&#252;ndlich-praktischen Pr&#252;fungen zu steigern sind Fort- und Weiterbildungsma&#223;nahmen der Pr&#252;fenden <TextLink reference="4"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. Inhaltlich werden dabei Ma&#223;nahmen und Strategien vermittelt, die sowohl die Vorbereitung als auch die Durchf&#252;hrung von Pr&#252;fungen sowie auch die Bewertung der Pr&#252;fungsleistungen optimieren k&#246;nnen <TextLink reference="6"></TextLink>.</Pgraph><Pgraph>In Baden-W&#252;rttemberg wurde 2007 vom Kompetenznetz &#8222;Lehre in der Medizin&#8220; <TextLink reference="14"></TextLink> ein M2-Pr&#252;ferworkshop konzipiert, der an allen baden-w&#252;rttembergischen Fakult&#228;ten zur Vorbereitung der Pr&#252;fenden auf den m&#252;ndlich-praktischen Teil regelm&#228;&#223;ig durchgef&#252;hrt wird. Der acht Unterrichtseinheiten umfassende Workshop untergliedert sich in Seminaranteile und praktische &#220;bungen. Hier werden die Ziele &#8222;reibungsloser Pr&#252;fungsablauf&#8220;, &#8222;Pr&#252;fungen auf Grund bestehender Erfahrungen optimieren&#8220;, &#8222;Pr&#252;fungsfragen und &#8211;aufgaben formulieren&#8220; sowie &#8222;kriterienbezogene Notenvergabe etablieren&#8220; verfolgt <TextLink reference="7"></TextLink>.</Pgraph><Pgraph>In einer Studie von &#214;chsner, Geiler und Huber-Lang wurden mittels Selbsteinsch&#228;tzungsfragebogen die durch M2-Pr&#252;ferworkshops fortgebildeten Pr&#252;fenden an der Medizinischen Fakult&#228;t in Ulm retrospektiv zu den Effekten und der Nachhaltigkeit des Pr&#252;ferworkshops befragt <TextLink reference="7"></TextLink>. Die Pr&#252;fenden wurden zu den Kernfragestellungen &#8222;bewusster Umgang mit St&#228;rken und Schw&#228;chen der M2-Pr&#252;fung&#8220;, &#8222;Kenntnisse &#252;ber den Einfluss der Reliabilit&#228;t und Validit&#228;t auf die m&#252;ndlich-praktische-Pr&#252;fung&#8220;, &#8222;Sicherheit bei der Aufgabenkonstruktion und Pr&#252;fungsregularien&#8220; und &#8222;Umsetzung des Konzepts des strukturierten m&#252;ndlichen Pr&#252;fens&#8220; befragt. Die Ergebnisse zu allen Kernfragestellungen lassen auf einen Nutzen des Pr&#252;ferworkshops schlie&#223;en und konnten bei den Pr&#252;fenden auch zwei Jahre nach der Absolvierung des Pr&#252;ferworkshops nachgewiesen werden. Angrenzend an die in dieser Studie beleuchtete Perspektive der Pr&#252;fenden soll bei der vorliegenden Analyse der Fokus auf den Output, die Notengebung an der Medizinischen Fakult&#228;t in Freiburg, gelegt werden.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Aim">
      <MainHeadline>Aim</MainHeadline><Pgraph>The aim of this study is to analyze the grading of the oral&#47;practical M2 examination at the medical school in Freiburg in order to assess the internal quality assurance measures. The following four aspects were scrutinized:</Pgraph><Pgraph><UnorderedList><ListItem level="1">The correlation between written and oral&#47;practical M2 grades;</ListItem><ListItem level="1">The difference in grading at the hospitals where testing was conducted: University Medical Center (UMC) versus the teaching hospitals;</ListItem><ListItem level="1">The difference in scoring between the examiners with and without prior training in one of the workshops;</ListItem><ListItem level="1">In-depth analysis of workshop sustainability in regard to grading.</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Zielsetzung">
      <MainHeadline>Zielsetzung</MainHeadline><Pgraph>Ziel der vorliegenden Studie war es, die Notenvergabe zur m&#252;ndlich-praktischen M2-Pr&#252;fung an der Medizinischen Fakult&#228;t Freiburg zu analysieren, um die internen Qualit&#228;tssicherungsma&#223;nahmen zu pr&#252;fen. Hierf&#252;r wurde folgenden vier Fragestellungen nachgegangen:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Zusammenhang zwischen schriftlichen und m&#252;ndlich-praktischen M2-Pr&#252;fungsnoten</ListItem><ListItem level="1">Unterschied in der Notengebung an den Pr&#252;fungskrankenh&#228;usern: UKL versus ALKs</ListItem><ListItem level="1">Unterschied in der Notengebung zwischen den Pr&#252;fenden mit und ohne voriger Absolvierung eines Pr&#252;ferworkshop</ListItem><ListItem level="1">Vertiefte Analyse zur Nachhaltigkeit des Pr&#252;ferworkshop bez&#252;glich der Notengebung.</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Method">
      <MainHeadline>Method</MainHeadline><Pgraph>To analyze the assignment of grades for the oral&#47;practical M2 exams, the Examination Office of Baden-W&#252;rttemberg (<Mark2>Landespr&#252;fungsamt)</Mark2> provided the anonymized data for the examinees in the 2012 spring and fall cohorts. Information was available on the candidates&#8217; written and oral&#47;practical scores, as well as on the corresponding examination committees. In addition, it was known which examiners had previously completed the training workshop.</Pgraph><Pgraph>The size of the sample of examinees was N&#61;315. The data set encompassed a total of 94 examination committees. An exam candidate was assigned to trained examiners for the analysis if one committee member had undergone training. The data were then entered and processed in SPSS (2012, version 20). Analysis was performed on the basis of the conventions of B&#252;hner &#38; Ziegler <TextLink reference="15"></TextLink> and Bortz <TextLink reference="16"></TextLink> and included descriptive statistical calculations and theory-based testing of hypotheses using inferential statistics.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Methodik">
      <MainHeadline>Methodik</MainHeadline><Pgraph>Zur Analyse der Notengebung der m&#252;ndlich-praktischen M2- Pr&#252;fung wurden die Daten der Pr&#252;fungskandidierenden der Fr&#252;hjahrs- und Herbstkohorte 2012 vom Landespr&#252;fungsamt f&#252;r Medizin und Pharmazie Baden-W&#252;rttemberg in anonymisierter Form zur Verf&#252;gung gestellt. Es lagen Angaben zu den schriftlichen und m&#252;ndlich-praktischen Noten der Pr&#252;flinge sowie zu den entsprechenden Pr&#252;fungskommissionen der m&#252;ndlich-praktischen Pr&#252;fung vor. Zudem war bekannt, welche Pr&#252;fenden zuvor einen Pr&#252;ferworkshop absolviert hatten. </Pgraph><Pgraph>Die Stichprobe der Pr&#252;flinge umfasste eine Fallzahl von N&#61;315. Der Datensatz umfasste insgesamt 94 Pr&#252;fungskommissionen. Ein Pr&#252;fling wurde bei der Analyse geschulten Pr&#252;fenden zugeordnet, sobald ein Kommissionsmitglied geschult war. Die Daten wurden in SPSS (2012, Version 20) eingegeben und dort verarbeitet. Die Auswertung erfolgte auf der Grundlage der Konventionen von B&#252;hner und Ziegler <TextLink reference="15"></TextLink> und Bortz <TextLink reference="16"></TextLink> und umfasste deskriptive statistische Berechnungen und theoriegeleitete Hypothesenpr&#252;fung mittels Inferenzstatistik.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Results">
      <MainHeadline>Results</MainHeadline><Pgraph>First, the correlation between the M2 examinees&#8217; scores on the written part and the oral&#47;practical part was analyzed. The written scores displayed a mean value (M) of 2.45 (standard deviation (SD)&#61;0.744). In contrast, a higher mean was calculated for the scores for the oral&#47;practical part (M&#61;1.92, SD&#61;0.716). The grade of &#8220;very good&#8221; was assigned much more frequently for performance on the oral&#47;practical part than for written test performance. Between the written and oral&#47;practical scores, a slight linear correlation was seen with a highly significant rank correlation coefficient of &#961;&#61;0.460&#42;&#42;.</Pgraph><Pgraph>It was then investigated if differences existed between the assignment of grades at the UMC and the other teaching hospitals. The mean and standard deviation for the UMC were M&#61;1.95 and SD&#61;0.768; for the teaching hospital these were M&#61;1.88 and SD&#61;0.661. Applying the Mann-Whitney U test, no significant difference between the two hospital groups was detected (&#961;&#61;0.682, &#934;&#61;0.023).</Pgraph><Pgraph>In addition, we checked for differences in the grading depending on if the oral&#47;practical M2 exam was administered by examiners who had previously attended the workshop. The dichotomous variable was defined in that we evaluated whether or not an individual candidate was examined by a committee composed of examiners who had or had not undergone specific training. The analysis of the data for those with workshop training showed a mean of M&#61;1.99 (SD&#61;0.741); for those without the workshop the value is M&#61;1.70 (SD&#61;0.634). Using the Mann-Whitney U test, it could be shown that a highly significant difference of &#961;&#61;0.007&#42;&#42;, with a weak effect of F&#61;0.165, exists between the two groups regarding the distribution of the grades.</Pgraph><Pgraph>This calculation was carried out again in regard to the sustainability of the M2 examiner workshop. Here, the variable regarding the length of time between administering the exam and attending the workshop was evaluated. Examination committees were considered trained if workshop attendance had taken place no less than one year ago. For this group, the trained examiners displayed a mean of M&#61;2.08 (SD&#61;0.782). For the group of examiners who had not received training (or had attended the workshop over a year ago), the following value was determined: M&#61;1.72 (SD&#61;0.642). With the Mann-Whitney U test, a highly significant difference of &#961;&#61;0.000&#42;&#42; was calculated with a small effect &#934;&#61;0.233.</Pgraph><Pgraph>A summary of these results is presented in Table 1 <ImgLink imgNo="1" imgType="table"/> and Table 2 <ImgLink imgNo="2" imgType="table"/>.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><Pgraph>Zuerst wurde der Zusammenhang zwischen den schriftlichen Noten und den m&#252;ndlich-praktischen Noten der M2-Pr&#252;flinge untersucht. Bei den schriftlichen Noten lag der Mittelwert (M) bei 2,45 (Standardabweichung (SD)&#61;0,744). Bei den m&#252;ndlich-praktischen Noten hingegen, wurde ein besserer Mittelwert (M&#61;1,92, SD&#61;0,716) ermittelt. Die Note &#8222;sehr gut&#8220; wurde erheblich h&#228;ufiger m&#252;ndlich-praktisch vergeben als schriftlich. Zwischen der schriftlichen und der m&#252;ndlich-praktischen Note zeigte sich ein schwacher linearer Zusammenhang mit einem hochsignifikanten Rangkorrelationskoeffizient von &#961;&#61;0,460&#42;&#42;.</Pgraph><Pgraph>Anschlie&#223;end wurde untersucht, ob sich Unterschiede in der Notenvergabe zwischen dem UKL und den ALKs finden.</Pgraph><Pgraph>Der Mittelwert und die Standardabweichung vom UKL lagen bei M&#61;1,95 und SD&#61;0,768, bei den ALKs bei M&#61;1,88 und SD&#61;0,661. Mittels Mann-Whitney-U-Test wurde kein signifikanter Unterschied zwischen den beiden Gruppen der Pr&#252;fungskrankenh&#228;user ermittelt (&#961;&#61;0,682, &#934;&#61;0,023).</Pgraph><Pgraph>Ferner wurde der Fragestellung nachgegangen, ob sich Unterschiede in der Benotung finden, wenn die m&#252;ndlich-praktische M2-Pr&#252;fung von Pr&#252;fenden abgenommen wurde, die zuvor einen Pr&#252;ferworkshop absolviert haben. Die dichotome Variable wurde mittels Betrachtung des einzelnen Pr&#252;flings gebildet, indem bewertet wurde, ob diese&#47;-r durch eine Pr&#252;fungskommission mit oder ohne fortgebildeten Pr&#252;fenden gepr&#252;ft wurde. Die Analyse der Daten f&#252;r die Auspr&#228;gung mit Pr&#252;ferworkshop zeigt einen Mittelwert von M&#61;1,99 (SD&#61;0,741), ohne Pr&#252;ferworkshop ist der Wert M&#61;1,70 (SD&#61;0,634). Mittels Mann-Whitney-U-Test konnte gezeigt werden, dass zwischen den beiden Gruppen ein hochsignifikanter Unterschied in der Verteilung der Noten von &#961;&#61;0,007&#42;&#42; besteht  &#8211; bei einem schwachen Effekt von &#934;&#61;0,165.</Pgraph><Pgraph>Erneut wurde diese Rechnung in Bezug auf die Nachhaltigkeit des M2-Pr&#252;ferworkshops durchgef&#252;hrt. Hierzu wurde die Variable bez&#252;glich des zeitlichen Abstandes zwischen Pr&#252;fung und Pr&#252;ferworkshops bewertet. Dabei galten Kommissionen als geschult, wenn der Workshop nicht l&#228;nger als maximal ein Jahr zur&#252;ck lag. Bei dieser Gruppe der geschulten Pr&#252;fenden zeigte sich ein Mittelwert von M&#61;2,08 (SD&#61;0,782). Bei der Gruppe der Pr&#252;fenden, die nicht geschult waren (bzw. bei denen der Workshop l&#228;nger als ein Jahr zur&#252;ck lag) ergab sich folgender Wert: M&#61;1,72 (SD&#61;0,642). Mittels Mann-Whitney-U-Test konnte ein hochsignifikanter Unterschied von &#961;&#61;0,000&#42;&#42; errechnet werden mit einem kleinen Effekt von &#934;&#61;0,233.</Pgraph><Pgraph>Die zusammenfassende Darstellung der Ergebnisse findet sich in Tabelle 1 <ImgLink imgNo="1" imgType="table"/> und Tabelle 2 <ImgLink imgNo="2" imgType="table"/>.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Discussion and Conclusions">
      <MainHeadline>Discussion and Conclusions</MainHeadline><Pgraph>The analysis of the grading was able to show that the efforts put into quality assurance at the Medical Faculty of Freiburg are worthwhile.</Pgraph><Pgraph>A highly significant correlation of &#961;&#61;0.460&#42;&#42; was determined between the written and oral&#47;practical grades. When focusing on the descriptive data analysis, it is seen that the scores assigned for oral&#47;practical performance are on average better than those given for the written part. The grade of &#8220;very good&#8221; is assigned much more frequently for oral&#47;practical performance than for written. This phenomenon has also been described in the literature <TextLink reference="17"></TextLink>.</Pgraph><Pgraph>The results of the other investigated aspects reveal no meaningful differences between the UMC and the other teaching hospitals concerning grading for the oral&#47;practical M2 exam. This result can be viewed as an indication that the efforts to establish a uniform and comparable testing practice at all the hospitals are effective and should be retained at the Medical Faculty of Freiburg.</Pgraph><Pgraph>The results regarding the difference between candidates who were examined by committees with trained members or those without show a highly significant difference of p&#61;0.007&#42;&#42; with a small effect &#934;&#61;0.165. When looking carefully at the descriptive data, it is seen that committees with members who have attended the workshop give the grade of &#8220;very good&#8221; more seldom and assign a wider range of grades overall.</Pgraph><Pgraph>When examining the sustainability of the workshop (committees were defined as trained if the workshop had taken place less than one year prior), the result is even clearer: p&#61;0.000&#42;&#42; with the effect of &#934;&#61;0.233. The results presented here contrast with the study done by &#214;chsner, Geiler &#38; Huber-Lang, in which evidence was found showing workshop sustainability over a period of two years on the basis of self-evaluation by the examiners <TextLink reference="7"></TextLink>. Pertinent effects should be investigated in more detail in subsequent studies. Moreover, the role of the examination committee chairman should be included in the analysis. In the present study it was not possible to examine this aspect more closely.</Pgraph><Pgraph>Whether or not the observed change in examiners&#8217; grading after completing the workshop is accompanied by a higher quality of testing cannot be conclusively established. A positive effect of the workshop on grading does appear to be present, since the content imparted during the workshops is meant to assist in adequately assigning grades in terms of quality criteria.</Pgraph><Pgraph>In conclusion, it can be asserted that the M2 workshop helps achieve the highest quality possible for the oral&#47;practical M2 examinations administered at the Medical Faculty of Freiburg. As a result, the M2 workshop can be recommended for all examiners <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>.</Pgraph><Pgraph>However, it must be pointed out that subject-specific testing cultures demonstrate a high level of stability over time when it comes to determining grades <TextLink reference="4"></TextLink>. For this reason, it is recommended that any existing quality assurance measures regarding test quality be retained and intensified in order to effect long-term change in the testing practices related to grading. An indication for this could also be the higher significance for the analysis of the sustainability and the slight increase in effect size. In respect to this, a regular review of the knowledge gained in the M2 workshop should be considered; however, further studies are needed on the sustainability of acquired grading practices and of testing cultures in general.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Diskussion und Schlussfolgerungen">
      <MainHeadline>Diskussion und Schlussfolgerungen</MainHeadline><Pgraph>Die Analyse der Notenvergabe konnte zeigen, dass sich die Bem&#252;hungen der Qualit&#228;tssicherung an der Medizinischen Fakult&#228;t Freiburg lohnen.</Pgraph><Pgraph>Es konnte ein hochsignifikanter Zusammenhang von &#961;&#61;0,460&#42;&#42; zwischen schriftlicher und m&#252;ndlich-praktischer Notengebung ermittelt werden. Bei Betrachtung der deskriptiven Datenanalyse zeigt sich, dass die m&#252;ndlich-praktisch vergebenen Noten im Vergleich zu den schriftlichen im Mittel besser ausfallen. Die Note &#8222;sehr gut&#8220; wird erheblich h&#228;ufiger m&#252;ndlich-praktisch als schriftlich vergeben. Dies entspricht einem auch in der Literatur beschriebenem Ph&#228;nomen <TextLink reference="17"></TextLink>.</Pgraph><Pgraph>Die Ergebnisse der weiteren Fragestellung zeigen keinen bedeutsamen Unterschied in der Benotung der m&#252;ndlich-praktischen M2-Pr&#252;fung zwischen dem UKL und den ALKs. Dieses Ergebnis kann als Hinweis gewertet werden, dass sich die unternommenen Anstrengungen, zwischen allen Pr&#252;fungskrankenh&#228;usern eine einheitliche und gleichwertige Pr&#252;fungspraxis herzustellen, lohnen und somit folglich an der Medizinischen Fakult&#228;t Freiburg weiter beibehalten werden sollten.</Pgraph><Pgraph>Die Ergebnisse bez&#252;glich des Unterschieds zwischen Pr&#252;flingen, die von Pr&#252;fungskommissionen mit oder ohne fortgebildeten Mitgliedern gepr&#252;ft wurden zeigen einen hochsignifikanten Unterschied von p&#61;0,007&#42;&#42; mit einem schwachen Effekt &#934;&#61;0,165. Bei der Betrachtung der deskriptiven Daten zeigt sich, dass Kommissionen mit Mitgliedern die einen Pr&#252;ferworkshop absolvierten seltener die Note &#8222;sehr gut&#8220; sowie ein generell breiteres Notenspektrum vergeben. </Pgraph><Pgraph>Bei Betrachtung der Nachhaltigkeit des Workshops (Kommissionen galten als geschult, wenn der Workshop nicht l&#228;nger als maximal ein Jahr zur&#252;ck lag) wird das Ergebnis noch deutlicher: p&#61;0,000&#42;&#42; mit dem Effekt von &#934;&#61;0,233. Die hier dargestellten Ergebnisse stehen in Kontrast zur Studie von &#214;chsner, Geiler und Huber-Lang. Dort wurden &#252;ber einen Zeitraum von zwei Jahren anhand der Selbsteinsch&#228;tzung der Pr&#252;fenden Hinweise f&#252;r die Nachhaltigkeit des Pr&#252;ferworkshops gewonnen <TextLink reference="7"></TextLink>. Entsprechende Effekte gilt es in Folgestudien genauer zu analysieren. Hierbei sollte zus&#228;tzlich auch die Rolle der Pr&#252;fungsvorsitzenden in die Analyse aufgenommen werden. In dieser Studie konnte dieser Aspekt nicht n&#228;her untersucht werden.</Pgraph><Pgraph>Ob die festgestellte ver&#228;nderte Notenvergabe nach Absolvierung eines Pr&#252;ferworkshops mit einer h&#246;heren G&#252;te der Pr&#252;fung einhergeht, l&#228;sst sich nicht abschlie&#223;end kl&#228;ren. Ein positiver Effekt des Pr&#252;ferworkshops auf die Notenvergabe erscheint begr&#252;ndet, da die dort gelehrten Inhalte den Pr&#252;fenden zu ad&#228;quater Notenfindung im Sinne der G&#252;tekriterien helfen sollen.</Pgraph><Pgraph>Schlussfolgernd kann festgehalten werden, dass das Ziel, an der Medizinischen Fakult&#228;t Freiburg eine h&#246;chstm&#246;gliche Qualit&#228;t der m&#252;ndlich-praktischen M2-Pr&#252;fung zu erreichen, durch die M2-Pr&#252;ferworkshops unterst&#252;tzt werden kann. Somit l&#228;sst sich der M2-Pr&#252;ferworkshop f&#252;r alle Pr&#252;fenden empfehlen <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>.</Pgraph><Pgraph>Es muss jedoch darauf hingewiesen werden, dass fachspezifische Pr&#252;fungskulturen zur Notengebung eine hohe zeitliche Stabilit&#228;t aufweisen <TextLink reference="4"></TextLink>. Aus diesem Grund ist zu empfehlen, eingef&#252;hrte Qualit&#228;tssicherungsma&#223;nahmen bez&#252;glich der Pr&#252;fungsqualit&#228;t beizubehalten und zu intensivieren, um eine langfristige &#196;nderung der Pr&#252;fungspraktiken im Hinblick auf die Notenfindung zu bewirken. Auch die Intensivierung der Signifikanz bei der Untersuchung der Nachhaltigkeit sowie der leichte Anstieg der Effektst&#228;rke k&#246;nnen ein Indiz hierf&#252;r sein. So sollte man diesbez&#252;glich &#252;ber eine regelm&#228;&#223;ige Auffrischung der Kenntnisse aus dem M2-Pr&#252;ferworkshop nachdenken. Allerdings sind weitere Untersuchungen zur Nachhaltigkeit von erlernten Praktiken bei der Notengebung und von allgemeinen Pr&#252;fungskulturen notwendig.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autoren erkl&#228;ren, dass sie keine Interessenkonflikte im Zusammenhang mit diesem Artikel haben. </Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Bundesministerium f&#252;r Gesundheit (BMG)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2002</RefYear>
        <RefBookTitle>Approbationsordnung f&#252;r &#196;rzte: A&#196;ppO, Teil I</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Bundesministerium f&#252;r Gesundheit (BMG). Approbationsordnung f&#252;r &#196;rzte: A&#196;ppO, Teil I. Berlin: Bundesministerium f&#252;r Gesundheit; 2002.</RefTotal>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Krautter M</RefAuthor>
        <RefAuthor>J&#252;nger J</RefAuthor>
        <RefAuthor>Koehl-Hackert N</RefAuthor>
        <RefAuthor>Nagelmann L</RefAuthor>
        <RefAuthor>Nikendei C</RefAuthor>
        <RefTitle>Evaluation eines strukturierten Pr&#252;fungsvorbereitungsprogramms f&#252;r das 2. Staatsexamen (M2) nach Neuer &#196;rztlicher Approbationsordnung: Eine quantitative Analyse</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>ZFEQ</RefJournal>
        <RefPage>110&#8211;115</RefPage>
        <RefTotal>Krautter M, J&#252;nger J, Koehl-Hackert N, Nagelmann L, Nikendei C. Evaluation eines strukturierten Pr&#252;fungsvorbereitungsprogramms f&#252;r das 2. Staatsexamen (M2) nach Neuer &#196;rztlicher Approbationsordnung: Eine quantitative Analyse. ZFEQ. 2012;106(2):110&#8211;115. DOI: 10.1016&#47;j.zefq.2011.09.020</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.zefq.2011.09.020</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Nikendei C</RefAuthor>
        <RefAuthor>Weyrich P</RefAuthor>
        <RefAuthor>J&#252;nger J</RefAuthor>
        <RefAuthor>Schrauth M</RefAuthor>
        <RefTitle>Medical Education in Germany</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>591&#8211;600</RefPage>
        <RefTotal>Nikendei C, Weyrich P, J&#252;nger J, Schrauth M. Medical Education in Germany. Med Teach. 2009;31(7):591&#8211;600. DOI: 10.1080&#47;01421590902833010</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1080&#47;01421590902833010</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>M&#252;ller-Benedict V</RefAuthor>
        <RefAuthor>Tsarouha E</RefAuthor>
        <RefTitle>K&#246;nnen Examensnoten verglichen werden&#63; Eine Analyse von Einfl&#252;ssen des sozialen Kontextes auf Hochschulpr&#252;fungen</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Z Soziol</RefJournal>
        <RefPage>388&#8211;409</RefPage>
        <RefTotal>M&#252;ller-Benedict V, Tsarouha E. K&#246;nnen Examensnoten verglichen werden&#63; Eine Analyse von Einfl&#252;ssen des sozialen Kontextes auf Hochschulpr&#252;fungen. Z Soziol. 2011;40(5):388&#8211;409.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Weber WD</RefAuthor>
        <RefTitle>Internationale Vergleichbarkeit von Noten im Hochschulbereich&#63;: Problematik der Notenvergabe, Referenzgr&#246;&#223;en und der Verwendung der Gau&#223;&#8217;schen Normalverteilung</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Qual Wissenschaft</RefJournal>
        <RefPage>20&#8211;23</RefPage>
        <RefTotal>Weber WD. Internationale Vergleichbarkeit von Noten im Hochschulbereich&#63;: Problematik der Notenvergabe, Referenzgr&#246;&#223;en und der Verwendung der Gau&#223;&#8217;schen Normalverteilung. Qual Wissenschaft. 2010;4(1):20&#8211;23.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Fabry G</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Medizindidaktik: Ein Handbuch f&#252;r die Praxis. Programmbereich Medizin</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Fabry G. Medizindidaktik: Ein Handbuch f&#252;r die Praxis. 1 Aufl. Programmbereich Medizin. Bern: Verlag Hans Huber; 2008.</RefTotal>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>&#214;chsner W</RefAuthor>
        <RefAuthor>Geiler S</RefAuthor>
        <RefAuthor>Huber-Lang M</RefAuthor>
        <RefTitle>Effekte und Nachhaltigkeit von Trainingsworkshops f&#252;r den m&#252;ndlich-praktischen Teil des M2-Examens</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefPage>Doc36</RefPage>
        <RefTotal>&#214;chsner W, Geiler S, Huber-Lang M. Effekte und Nachhaltigkeit von Trainingsworkshops f&#252;r den m&#252;ndlich-praktischen Teil des M2-Examens. GMS Z Med Ausbild. 2013;30(3):Doc36. DOI: 10.3205&#47;zma000879</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3205&#47;zma000879</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Fischer MR</RefAuthor>
        <RefAuthor>Holzer M</RefAuthor>
        <RefAuthor>J&#252;nger J</RefAuthor>
        <RefTitle>Pr&#252;fungen an den medizinischen Fakult&#228;ten - Qualit&#228;t, Verantwortung und Perspektiven</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefPage>Doc66</RefPage>
        <RefTotal>Fischer MR, Holzer M, J&#252;nger J. Pr&#252;fungen an den medizinischen Fakult&#228;ten - Qualit&#228;t, Verantwortung und Perspektiven. GMS Z Med Ausbild. 2010;27(5):Doc66. DOI: 10.3205&#47;zma000703</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3205&#47;zma000703</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Schuwirth LW</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefTitle>Changing education, changing assessment, changing research&#63;</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>805&#8211;812</RefPage>
        <RefTotal>Schuwirth LW, van der Vleuten CP. Changing education, changing assessment, changing research&#63; Med Educ. 2004;38(8):805&#8211;812. DOI: 10.1111&#47;j.1365-2929.2004.01851.x</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1111&#47;j.1365-2929.2004.01851.x</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Khera N</RefAuthor>
        <RefAuthor>Davies H</RefAuthor>
        <RefAuthor>Davies H</RefAuthor>
        <RefAuthor>Lissauer T</RefAuthor>
        <RefAuthor>Skuse D</RefAuthor>
        <RefAuthor>Wakeford</RefAuthor>
        <RefAuthor>R</RefAuthor>
        <RefAuthor>Stroobant J</RefAuthor>
        <RefTitle>How should paediatric examiners be trained&#63;</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Arch Dis Child</RefJournal>
        <RefPage>43&#8211;47</RefPage>
        <RefTotal>Khera N, Davies H, Davies H, Lissauer T, Skuse D, Wakeford, R, Stroobant J. How should paediatric examiners be trained&#63; Arch Dis Child. 2005;90(1):43&#8211;47. DOI: 10.1136&#47;adc.2004.055103</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;adc.2004.055103</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Seyfarth M</RefAuthor>
        <RefAuthor>Reincke M</RefAuthor>
        <RefAuthor>Seyfarth J</RefAuthor>
        <RefAuthor>Ring J</RefAuthor>
        <RefAuthor>Fischer MR</RefAuthor>
        <RefTitle>Neue &#228;rztliche Approbationsordnung und Notengebung beim Zweiten Staatsexamen: Eine Untersuchung an zwei bayerischen medizinischen Fakult&#228;ten</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Dtsch Arztbl Int</RefJournal>
        <RefPage>500&#8211;504</RefPage>
        <RefTotal>Seyfarth M, Reincke M, Seyfarth J, Ring J, Fischer MR. Neue &#228;rztliche Approbationsordnung und Notengebung beim Zweiten Staatsexamen: Eine Untersuchung an zwei bayerischen medizinischen Fakult&#228;ten. Dtsch Arztbl Int. 2010;28-29:500&#8211;504. DOI: 10.3238&#47;arztebl.2010.0500</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3238&#47;arztebl.2010.0500</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Wakeford R</RefAuthor>
        <RefAuthor>Southgate L</RefAuthor>
        <RefAuthor>Wass V</RefAuthor>
        <RefTitle>Improving oral examinations: selecting, training, and monitoring examiners for the MRCGP: Royal College of General Practitioners</RefTitle>
        <RefYear>1995</RefYear>
        <RefJournal>BMJ</RefJournal>
        <RefPage>931&#8211;935</RefPage>
        <RefTotal>Wakeford R, Southgate L, Wass V. Improving oral examinations: selecting, training, and monitoring examiners for the MRCGP: Royal College of General Practitioners. BMJ. 1995;311:931&#8211;935. DOI: 10.1136&#47;bmj.311.7010.931</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;bmj.311.7010.931</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Schuwirth L</RefAuthor>
        <RefTitle>The need for national licensing examinations</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>1022&#8211;1023</RefPage>
        <RefTotal>Schuwirth L. The need for national licensing examinations. Med Educ. 2007;41(11):1022&#8211;1023. DOI: 10.1111&#47;j.1365-2923.2007.02856.x</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1111&#47;j.1365-2923.2007.02856.x</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Fegert J</RefAuthor>
        <RefAuthor>Obertacke U</RefAuthor>
        <RefAuthor>Resch F</RefAuthor>
        <RefAuthor>Hilzenbecher M</RefAuthor>
        <RefTitle>Die Qualit&#228;t der Lehre nicht dem Zufall &#252;berlassen</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Dtsch Arztebl</RefJournal>
        <RefPage>290&#8211;291</RefPage>
        <RefTotal>Fegert J, Obertacke U, Resch F, Hilzenbecher M. Die Qualit&#228;t der Lehre nicht dem Zufall &#252;berlassen. Dtsch Arztebl. 2009;106(7):290&#8211;291.</RefTotal>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>B&#252;hner M</RefAuthor>
        <RefAuthor>Ziegler M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2012</RefYear>
        <RefBookTitle>Statistik f&#252;r Psychologen und Sozialwissenschaftler. Always learning</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>B&#252;hner M, Ziegler M. Statistik f&#252;r Psychologen und Sozialwissenschaftler. Always learning. M&#252;nchen: Pearson Studium; 2012.</RefTotal>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Bortz J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2005</RefYear>
        <RefBookTitle>Statistik f&#252;r Human- und Sozialwissenschaftler</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Bortz J. Statistik f&#252;r Human- und Sozialwissenschaftler. 6 Aufl. Heidelberg: Springer-Verlag; 2005.</RefTotal>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Bussche van HD</RefAuthor>
        <RefAuthor>Wegscheider K</RefAuthor>
        <RefAuthor>Zimmermann T</RefAuthor>
        <RefTitle>Medizinische Fakult&#228;ten: Der Ausbildungserfolg im Vergleich (III)</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Dtsch Arztbl Int</RefJournal>
        <RefPage>B-2762&#47;C-2644</RefPage>
        <RefTotal>Bussche van HD, Wegscheider K, Zimmermann T. Medizinische Fakult&#228;ten: Der Ausbildungserfolg im Vergleich (III). Dtsch Arztbl Int. 2006;103(47):B-2762&#47;C-2644.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 1: Distribution by percentage</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Prozentuale Verteilung</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 2: Descriptive statistics</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Deskriptive Statistik</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>2</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>