<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma001574</Identifier>
    <IdentifierDoi>10.3205/zma001574</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0015747</IdentifierUrn>
    <IdentifierVgWort>http://vg02.met.vgwort.de/na/e24324000c4141dfad2f4376033339d9</IdentifierVgWort>
    <ArticleType language="en">article</ArticleType>
    <ArticleType language="de">Artikel</ArticleType>
    <TitleGroup>
      <Title language="en">Development of a diagnostic instrument for the assessment of teaching competencies in medicine (FKM&#95;L): First results of the test statistical verification</Title>
      <TitleTranslated language="de">Entwicklung eines Diagnoseinstruments zur Erfassung von Lehrkompetenzen in der Medizin (FKM&#95;L): Erste Ergebnisse der teststatistischen &#220;berpr&#252;fung</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Giesler</Lastname>
          <LastnameHeading>Giesler</LastnameHeading>
          <Firstname>Marianne</Firstname>
          <Initials>M</Initials>
          <AcademicTitle>Dr.</AcademicTitle>
        </PersonNames>
        <Address language="en">Freiburg, Germany<Affiliation>Freiburg, Germany</Affiliation></Address>
        <Address language="de">Freiburg, Deutschland<Affiliation>Freiburg, Deutschland</Affiliation></Address>
        <Email>Dr&#95;M&#95;Giesler&#64;t-online.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Lammerding-K&#246;ppel</Lastname>
          <LastnameHeading>Lammerding-K&#246;ppel</LastnameHeading>
          <Firstname>Maria</Firstname>
          <Initials>M</Initials>
        </PersonNames>
        <Address language="en">T&#252;bingen, Germany<Affiliation>T&#252;bingen, Germany</Affiliation></Address>
        <Address language="de">T&#252;bingen, Deutschland<Affiliation>T&#252;bingen, Deutschland</Affiliation></Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Griewatz</Lastname>
          <LastnameHeading>Griewatz</LastnameHeading>
          <Firstname>Jan</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>Kompetenzzentrum f&#252;r Hochschuldidaktik in Medizin Baden-W&#252;rttemberg, T&#252;bingen, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Kompetenzzentrum f&#252;r Hochschuldidaktik in Medizin Baden-W&#252;rttemberg, T&#252;bingen, Deutschland</Affiliation>
        </Address>
        <Email>jan.griewatz&#64;med.uni-tuebingen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">teaching competencies in medicine</Keyword>
      <Keyword language="en">self-assessment</Keyword>
      <Keyword language="en">self-reflection</Keyword>
      <Keyword language="en">diagnostic of competencies</Keyword>
      <Keyword language="de">Lehr-Kompetenzen in der Medizin</Keyword>
      <Keyword language="de">Selbsteinsch&#228;tzungen</Keyword>
      <Keyword language="de">Selbstreflexion</Keyword>
      <Keyword language="de">Kompetenzdiagnostik</Keyword>
      <SectionHeading language="en">teaching competencies</SectionHeading>
      <SectionHeading language="de">Lehrkompetenzen</SectionHeading>
    </SubjectGroup>
    <DateReceived>20220105</DateReceived>
    <DateRevised>20220728</DateRevised>
    <DateAccepted>20220804</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20221115</DatePublished><DateRepublished>20230209</DateRepublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>2366-5017</ISSN>
        <Volume>39</Volume>
        <Issue>5</Issue>
        <JournalTitle>GMS Journal for Medical Education</JournalTitle>
        <JournalTitleAbbr>GMS J Med Educ</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>53</ArticleNo>
    <Correction><DateLastCorrection>00010101</DateLastCorrection>A VG WORT counting pixel was added.&#47;Ein VG-WORT-Z&#228;hlpixel wurde erg&#228;nzt. </Correction>
    <Fundings>
      <Funding fundId="01PL17011B">BMBF</Funding>
      <Funding fundId="01PL17011A">BMBF</Funding>
    </Fundings>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Einf&#252;hrung:</Mark1> In diesem Projektbericht wird die Entwicklung und teststatistische &#220;berpr&#252;fung des <Mark2>Fragebogens zur Erfassung von Lehrkompetenzen in der Medizin</Mark2> (FKM&#95;L) beschrieben. Die Basis f&#252;r die Konzeption des FKM&#95;L bildete das Modell <Mark2>Kernkompetenzen f&#252;r Lehrende in der Medizin</Mark2> (KLM) des <Mark2>GMA Ausschusses Personal-&#47;Organisationsentwicklung in der Lehre</Mark2>.</Pgraph><Pgraph><Mark1>Methodik: </Mark1>F&#252;r die Teilkompetenzen der sechs Kernkompetenzen des KLM-Modells wurden jeweils Globalfragen und vertiefende Items formuliert. Je Kernkompetenz gibt es in Abh&#228;ngigkeit von der Zahl der Teilkompetenzen 3-4 Subskalen, die 69 Items umfassen. Alle Skalen wurden itemanalytisch &#252;berpr&#252;ft. Analysiert wurden Daten von 90 Teilnehmerinnen und Teilnehmern medizindidaktischer Kurse.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Die inneren Konsistenzen (Cronbachs Alpha: CR-&#945;) der 22 Subskalen liegen zwischen CR-&#945;&#61;.70 und CR-&#945;&#61;.93, die Schwierigkeitsindices der Items der Subskalen zwischen 18&#37; und 89&#37;. Bei 2 Subskalen wiesen einige Items einen Schwierigkeitsindex von &#252;ber 80&#37; auf, bei 3 Subskalen betrug der Schwierigkeitsindex einiger Items weniger als 25&#37;.</Pgraph><Pgraph><Mark1>Schlussfolgerung:</Mark1> Der FKM&#95;L wurde zur Erfassung von individuellen und gruppenbezogenen Kompetenzprofilen von Lehrenden in der Medizin entwickelt. Die Ergebnisse dieser ersten teststatistischen Analyse sind vielversprechend: Mit Hilfe des FKM&#95;L k&#246;nnen Lehrende im Rahmen medizindidaktischer Kurse Aspekte ihrer Lehrkompetenzen kennenlernen und reflektieren. Anhand ihrer FKM&#95;L-Profile k&#246;nnen sie entscheiden, ob sie ihre Kompetenzauspr&#228;gungen punktuell optimieren m&#246;chten. F&#252;r Anbieter eignet sich der FKM&#95;L als Screening-Instrument, um u.a. L&#252;cken im Ausbildungsangebot festzustellen. Weitere Analysen sind notwendig, um festgestellte Einschr&#228;nkungen bei einigen Skalen zu &#252;berpr&#252;fen und einzelne Items anzupassen. Dar&#252;ber hinaus ist eine &#220;berpr&#252;fung der Konstrukt- und der kriterienbezogenen Validit&#228;t des Instruments erforderlich.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Introduction:</Mark1> This project report describes the development of the <Mark2>Questionnaire for the Assessment of Teaching Competencies in Medicine</Mark2> (FKM&#95;L) and the analysis of some of its psychometric properties. The design of the FKM&#95;L is based on the model of<Mark2> Core Competency for Teachers in Medicine</Mark2> (KLM) model of the <Mark2>GMA Committee on Personnel and Organizational Development in Teaching</Mark2>.</Pgraph><Pgraph><Mark1>Methods:</Mark1> Global questions and in-depth items were formulated for each of the sub-competencies of the six core competencies of the KLM model. Depending on the number of sub-competencies, there are 3-4 subscales for each core competency, comprising 69 items in total. Data from 90 participants of medical didactic courses were analysed. Item analyses supported the hypothesized scales.</Pgraph><Pgraph><Mark1>Results: </Mark1>The internal consistencies (Cronbach&#39;s alpha: CR-&#945;) of the 22 subscales ranged from CR-&#945;&#61;.70 to CR-&#945;&#61;.93, and the item difficulty indices of the subscales ranged from 18&#37; to 89&#37;. For 2 subscales, some items had a difficulty index of more than 80&#37;, and for 3 subscales, the difficulty index of some items was less than 25&#37;.</Pgraph><Pgraph><Mark1>Conclusions: </Mark1>The FKM&#95;L was developed to assess individual and group profiles of teachers&#8217; competence in medicine. The results of this first psychometric analysis are promising: With the help of the FKM&#95;L, teachers can learn about and reflect on aspects of their teaching competencies in the context of medical didactic courses. Based on their FKM&#95;L profiles, they can decide whether they want to selectively optimize their competence characteristics. For providers, the FKM&#95;L is suitable as a screening tool to identify, among other things, gaps in the training offered. Further analyses are necessary to check limitations identified in some scales and to improve individual items. In addition, research on the construct and criterion-related validity of the instrument is required.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="Introduction">
      <MainHeadline>Introduction</MainHeadline><SubHeadline2>General background</SubHeadline2><Pgraph>Studies show that a teacher&#39;s subject-matter expertise alone is not a sufficient condition for the learning success of individuals being taught <TextLink reference="1"></TextLink>. Other subject-independent characteristics and competencies can significantly influence learning development <TextLink reference="2"></TextLink>. For school and university settings, conceptual approaches are available that describe competencies teachers should possess in order to cope well with the many and multifaceted tasks and challenges of teaching <TextLink reference="3"></TextLink>. For the field of medicine, the<Mark2> GMA Committee on Personnel and Organizational Development in Teaching</Mark2> derived a model based on the <Mark2>Six Core Teaching Competencies for Medical Educators</Mark2> by Srinivasan et al. <TextLink reference="4"></TextLink> that describes <Mark2>core competencies for teachers in medicine</Mark2> (KLM) <TextLink reference="2"></TextLink>. This model provides a framework of orientation for medical didactic competencies and indicates what a teacher&#8217;s qualification profile might look like. For providers of medical didactic qualification programs, the KLM model can be very helpful in orienting their continuing education and training programs in terms of content.</Pgraph><Pgraph>However, the KLM model itself cannot yet be used to determine the extent to which individual teachers possess the competencies described and&#47;or to which extent the medical didactic course offerings address these competencies. The core competencies are not described in a sufficiently differentiated manner for this purpose. However, they provide a good basis for developing an appropriate diagnostic tool.</Pgraph><SubHeadline2>Diagnosis of the degree of competence</SubHeadline2><Pgraph>For the diagnosis of the degree of competence or for determining the individual teacher&#39;s ability to act in complex (authentic) situations, external and self-assessments can be considered, which can be carried out formatively as well as summatively by means of observations, e.g., by checklists, or by using psychometric procedures <TextLink reference="5"></TextLink>, <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Both methods are subject to random and systematic errors, i.e., the measurement results cannot be perfectly reliable and valid <TextLink reference="8"></TextLink>. Self-assessments in particular have a reputation for limited reliability and, accordingly, limited validity <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>: In most cases, evidence is found that those who prove to be least competent are also those who are less accurate in assessing themselves <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>. There is also evidence that highly competent individuals may tend to underestimate their performance <TextLink reference="16"></TextLink>. Studies also show that women tend to underestimate their performance <TextLink reference="17"></TextLink>. In addition, women&#39;s and men&#8217;s self-assessments may differ depending on the domain of competence <TextLink reference="18"></TextLink>. Finally, there is also evidence that practical skills are better assessed than knowledge-based activities <TextLink reference="14"></TextLink>. However, self-assessments can be improved by feedback <TextLink reference="14"></TextLink>, <TextLink reference="19"></TextLink>. This can be achieved by providing feedback on the standards to be achieved and offering opportunities for comparison purposes (individual and social) <TextLink reference="12"></TextLink>, <TextLink reference="14"></TextLink>, <TextLink reference="20"></TextLink>. If the goal is to determine what is required to provide individually suitable offers for further qualification, the aggregation of self-assessment data may allow reliable diagnoses <TextLink reference="13"></TextLink>.</Pgraph><SubHeadline2>Objective</SubHeadline2><Pgraph>Up to now, there has been no suitable instrument available for the assessment of teaching competencies in medical university teaching that would identify individual and general approaches for the further development of competencies. Therefore, based on the KLM model described above, a diagnostic instrument for the <Mark2>Assessment of Teaching Competencies in Medicine</Mark2> (FKM&#95;L) was developed. This project report describes the development of this instrument and presents first results on its psychometric properties.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><SubHeadline2>Allgemeiner Hintergrund</SubHeadline2><Pgraph>Studien zeigen, dass die fachliche Expertise einer Lehrperson alleine keine hinreichende Voraussetzung f&#252;r den Lernerfolg von Personen ist, die unterrichtet werden <TextLink reference="1"></TextLink>. Weitere fachunabh&#228;ngige Merkmale und Kompetenzen k&#246;nnen erheblichen Einfluss auf die Lernentwicklung haben <TextLink reference="2"></TextLink>. Es existieren f&#252;r den schulischen und universit&#228;ren Bereich Ans&#228;tze, die Kompetenzen von Lehrkr&#228;ften beschreiben, &#252;ber die diese verf&#252;gen sollten, um die vielen und vielschichtigen Aufgaben und Herausforderungen gut bew&#228;ltigen zu k&#246;nnen <TextLink reference="3"></TextLink>. F&#252;r den Bereich Medizin wurde vom <Mark2>GMA Ausschuss f&#252;r Personal- und Organisationsentwicklung in der Lehre</Mark2> auf der Basis der <Mark2>Six Core Teaching Competencies for Medical Educators</Mark2> von Srinivasan et al. <TextLink reference="4"></TextLink> ein Modell abgeleitet, das<Mark2> Kernkompetenzen f&#252;r Lehrende in der Medizin</Mark2> (KLM) beschreibt <TextLink reference="2"></TextLink>. Dieses Modell stellt einen Orientierungsrahmen f&#252;r medizindidaktische Kompetenzen zur Verf&#252;gung und zeigt auf, wie ein Qualifikationsprofil f&#252;r Lehrende aussehen k&#246;nnte. F&#252;r Anbieter von medizindidaktischen Qualifikationsangeboten kann das KLM-Modell sehr hilfreich sein, um ihre Weiter- und Fortbildungen inhaltlich auszurichten.</Pgraph><Pgraph>Mit dem KLM-Modell selbst kann jedoch noch keine Standortbestimmung vorgenommen werden, um festzustellen, inwieweit einzelne Lehrkr&#228;fte &#252;ber die beschriebenen Kompetenzen verf&#252;gen und&#47;oder die medizindidaktischen Kursangebote diese Kompetenzen adressieren. Dazu sind die Kernkompetenzen nicht differenziert genug beschrieben. Sie bieten jedoch eine gute Grundlage f&#252;r die Entwicklung eines entsprechenden Diagnoseinstruments.</Pgraph><SubHeadline2>Diagnostik von Kompetenzauspr&#228;gungen</SubHeadline2><Pgraph>Zur Diagnose von Kompetenzauspr&#228;gungen oder zur Feststellung des Ausma&#223;es der individuellen Handlungsf&#228;higkeit in komplexen (authentischen) Situationen kommen Fremd- und Selbsteinsch&#228;tzungen in Betracht, die mittels Beobachtungen z.B. anhand von Checklisten oder durch den Einsatz von psychometrischen Verfahren sowohl formativ wie summativ erfolgen k&#246;nnen <TextLink reference="5"></TextLink>, <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Beide Methoden sind mit unsystematischen und systematischen Fehlern behaftet, d.h. die Messergebnisse k&#246;nnen nicht perfekt reliabel und valide sein <TextLink reference="8"></TextLink>. Vor allem den Selbsteinsch&#228;tzungen haftet der Ruf an, eingeschr&#228;nkt reliabel und dementsprechend auch begrenzt valide zu sein <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>: Meist finden sich Belege daf&#252;r, dass die, die sich am wenigsten kompetent erweisen, auch diejenigen sind, die sich weniger genau einsch&#228;tzen k&#246;nnen <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>. Es gibt zudem Belege daf&#252;r, dass sehr kompetente Personen dazu neigen k&#246;nnen, ihre Leistungen zu untersch&#228;tzen <TextLink reference="16"></TextLink>. Auch Frauen tendieren dazu, ihre Leistungen zu untersch&#228;tzen <TextLink reference="17"></TextLink>. Dar&#252;ber hinaus k&#246;nnen sich die Selbsteinsch&#228;tzungen von Frauen und M&#228;nner in Abh&#228;ngigkeit von der jeweiligen Kompetenzdom&#228;ne unterscheiden <TextLink reference="18"></TextLink>. Es gibt zudem Hinweise, dass praktische Fertigkeiten besser eingesch&#228;tzt werden als wissensbasierte Aktivit&#228;ten <TextLink reference="14"></TextLink>. Selbsteinsch&#228;tzungen k&#246;nnen jedoch durch Feedback verbessert werden <TextLink reference="14"></TextLink>, <TextLink reference="19"></TextLink>. Dies l&#228;sst sich dadurch erreichen, dass R&#252;ckmeldungen &#252;ber die zu erreichenden Standards zur Verf&#252;gung gestellt und Vergleichsm&#246;glichkeiten (individuelle und soziale) angeboten werden <TextLink reference="12"></TextLink>, <TextLink reference="14"></TextLink>, <TextLink reference="20"></TextLink>. Wenn zur Bereitstellung passender Qualifikationsangebote Standortbestimmungen bzw. Bedarfsanalysen ben&#246;tigt werden, kann die Aggregation von Selbsteinsch&#228;tzungsdaten durchaus reliable Diagnosen erm&#246;glichen <TextLink reference="13"></TextLink>.</Pgraph><SubHeadline2>Zielsetzung</SubHeadline2><Pgraph>F&#252;r die medizinische Hochschullehre steht bislang kein geeignetes Instrument zur Erfassung von Lehrkompetenzen zur Verf&#252;gung, um individuelle und generelle Ansatzpunkte zur Weiterentwicklung der Kompetenzen zu identifizieren. Es wurde daher ausgehend von dem oben beschriebenen KLM-Modell ein Diagnoseinstrument zur <Mark2>Erfassung von Lehrkompetenzen in der Medizin</Mark2> (FKM&#95;L) entwickelt. Dieser Projektbericht beschreibt die Entwicklung dieses Instruments und stellt erste teststatistische Ergebnisse dar.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Methods">
      <MainHeadline>Methods</MainHeadline><SubHeadline2>Development of the questionnaire</SubHeadline2><Pgraph>The <Mark2>Core Competency Model for Teachers in Medicine</Mark2> (KLM) served as the basis for our development of the <Mark2>Questionnaire for the Assessment of Teaching Competencies in Medicine</Mark2> (FKM&#95;L). In this model, sub-competencies are derived from six fields of competence, for each of which learning objectives and examples of application are also described. The FKM&#95;L is structured similarly. In a first step, so-called global items were formulated for the individual sub-competencies of the six competence fields. In a second step, in-depth items were developed for these global items, taking into account the respective learning objectives and examples of application as well as the expertise and experience of the questionnaire developers (see table 1 <ImgLink imgNo="1" imgType="table"/> and table 2 <ImgLink imgNo="2" imgType="table"/>), which were then combined into subscales. In formulating the items, attention was paid to conclusiveness and comprehensibility <TextLink reference="21"></TextLink>. In addition, participants were asked for feedback on the usefulness of their use of the FKM&#95;L immediately after having responding to it. This information was included in the further development of the instrument.</Pgraph><Pgraph>The FKM&#95;L includes 22 global items and 69 in-depth items, each of which is to be responded to on 5-point Likert-type scales (&#8220;1&#8221; not given at all to &#8220;5&#8221; given to a very high degree). Only the end points of the scales are semantically anchored.</Pgraph><Pgraph>For the development of the first version of this questionnaire, several meetings of the authors were held in the period from 2018 to 2019. Further revisions were made by way of circulation. Since the middle of 2019, the FKM&#95;L has been tested in the context of medical didactic offers of the <Mark2>Competence Center for University Teaching in Medicine Baden-W&#252;rttemberg in T&#252;bingen</Mark2>.</Pgraph><SubHeadline2>Sample</SubHeadline2><Pgraph>The analyses were based on the data of two groups of participants of medical didactic courses of the <Mark2>Competence Center for University Teaching in Medicine Baden-W&#252;rttemberg</Mark2>. These competence-oriented courses <TextLink reference="22"></TextLink> were held at different faculties in Baden-W&#252;rttemberg (Freiburg, Mannheim, T&#252;bingen) and included participants mainly from faculties in Baden-W&#252;rttemberg. In the winter semester 2019&#47;2020, 29 participants of the courses <Mark2>Medical Teaching Qualification I</Mark2> (MQ I, basic qualification) and 12 of the courses <Mark2>Medical Teaching Qualification II</Mark2> (MQ II, advanced qualification) completed the FKM&#95;L voluntarily. In the winter semester 2020&#47;2021 and summer semester, there were 49 participants who completed the FKM&#95;L as part of taking the <Mark2>Medical Teaching Qualification I</Mark2> courses.</Pgraph><Pgraph>Because of the small course sizes, we initially refrained from systematically collecting information on age and gender for data protection reasons. In subsequent surveys, this information was obtained on a voluntary basis along with consent forms. Therefore, more detailed information on gender and age is available from only 50 participants. At the time of the survey, these participants were on average 37 years old (SD&#61;5.95, Md&#61;35, Mo&#61;33), 41&#37; are women.</Pgraph><Pgraph>The FKM&#95;L is used immediately at the beginning of the courses (especially MQ I) as a didactic tool with the aim of introducing the topic of competencies and reflecting on the expressions of one&#39;s own teaching competencies. At later points in the course or in the subsequent advanced level, further assessments are carried out. To be able to record individual developments over time, reproducible anonymous codes can be used for the respondents.</Pgraph><SubHeadline2>Statistical analyses</SubHeadline2><Pgraph>Within the framework of item analyses according to the concept of so-called <Mark2>Classical Test Theory</Mark2>, corrected item total correlations as measures of discriminatory power and item difficulty each were calculated for every item. In addition, Cronbach&#39;s &#945; (CR-&#945;) was calculated for each competence scale as a measure of internal consistency.</Pgraph><Pgraph>The concept of item difficulty has originally been introduced in the context of achievement test construction. In this context, item difficulty is estimated using the so-called <Mark2>difficulty index</Mark2>. This is defined as the percentage of test takers who solve a test item <TextLink reference="23"></TextLink>. It should be noted that a numerically high value of the difficulty index indicates that the task or item in question is &#8220;easy&#8221; because a high percentage of respondents were able to solve it. Correspondingly, a numerically low difficulty index indicates the presence of a &#8220;difficult&#8221; item, insofar as it could only be solved by a low percentage of those tested. In order to determine the difficulty of items from self-assessment questionnaires with multiple graded response options, as in the present case, the following formula can be used to calculate the difficulty index, following D&#246;ring and Bortz <TextLink reference="24"></TextLink>: (M<Subscript>i</Subscript> - 1 &#47; k - 1) &#42; 100, where M<Subscript>i</Subscript> denotes the mean of the item in question and k the number of &#8211; coded continuously starting with 1 &#8211; levels of the response scale. </Pgraph><Pgraph>As measures of discriminatory power, item total correlations indicate how highly an item correlates with the total score of the associated scale or how well an item measures the construct to be captured by the scale <TextLink reference="24"></TextLink>, respectively. Corrected item total correlations &#60;.30 are considered low <TextLink reference="25"></TextLink>. Values between .30 and .50 are considered medium, and values greater than .50 are considered high.</Pgraph><Pgraph>There is a paraboloid relationship between discriminative power and difficulty <TextLink reference="23"></TextLink>, i.e., if the difficulty of an item is low, the discriminative power is also low, at an intermediate difficulty of 50&#37; the discriminative power reaches its maximum, thereafter, as the difficulty increases, the discriminative power decreases again. According to Lienert <TextLink reference="23"></TextLink>, however, medium difficulty does not necessarily mean good discriminatory power.</Pgraph><Pgraph>The following limits for CR-&#945; are generally used to describe reliability levels: high reliability &#62;.90 and low reliability &#60;.80. However, the meaning of these values may depend on the context and these limits should therefore not be applied too rigidly <TextLink reference="24"></TextLink>, <TextLink reference="25"></TextLink>.</Pgraph><Pgraph>Statistical analyses were performed using the statistical program SPSS, version 26.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Methodik">
      <MainHeadline>Methodik</MainHeadline><SubHeadline2>Entwicklung des Fragebogens</SubHeadline2><Pgraph>Als Basis f&#252;r die Entwicklung des <Mark2>Fragebogens zur Erfassung von Lehrkompetenzen in der Medizin</Mark2> (FKM&#95;L) diente das<Mark2> Kernkompetenzmodell f&#252;r Lehrende in der Medizin</Mark2> (KLM). In diesem Modell werden ausgehend von sechs Kompetenzfeldern jeweils Teilkompetenzen abgeleitet, f&#252;r die ebenfalls jeweils Lernziele und Anwendungsbeispiele beschrieben werden. Der FKM&#95;L ist &#228;hnlich aufgebaut. In einem ersten Schritt wurden f&#252;r die einzelnen Teilkompetenzen der sechs Kompetenzfelder sogenannte Globalitems formuliert. In einem zweiten Schritt wurden f&#252;r diese Globalitems unter Ber&#252;cksichtigung der jeweiligen Lernziele und Anwendungsbeispiele sowie der Expertise und den Erfahrungen der Fragebogenentwicklerinnen und -entwickler vertiefende Items entwickelt (siehe Tabelle 1 <ImgLink imgNo="1" imgType="table"/> und Tabelle 2 <ImgLink imgNo="2" imgType="table"/>), die anschlie&#223;end zu Subskalen zusammengefasst wurden. Bei der Formulierung der Items wurde auf inhaltliche Schl&#252;ssigkeit und Verst&#228;ndlichkeit <TextLink reference="21"></TextLink> geachtet. Zudem wurden die Teilnehmerinnen und Teilnehmer unmittelbar nach Beantwortung des FKM&#95;L um R&#252;ckmeldung zum Nutzen seines Einsatzes gebeten. Diese Angaben wurden in den Weiterentwicklungsprozess des Instrumentes einbezogen.</Pgraph><Pgraph>Der FKM&#95;L besteht aus 22 Globalitems und 69 vertiefenden Items, die jeweils anhand 5-stufiger Skalen zu beantworten sind (&#8222;1&#8220; gar nicht gegeben bis &#8222;5&#8220; in sehr hohem Ma&#223;e gegeben). Nur die Endkategorien der Skalen sind semantisch verankert.</Pgraph><Pgraph>F&#252;r die Erstellung der ersten Version dieses Fragebogens fanden im Zeitraum von 2018 bis 2019 mehrere Arbeitstreffen der beiden Autorinnen und des Autors statt. Die weiteren &#220;berarbeitungen erfolgten im Umlaufverfahren. Seit Mitte 2019 wird der FKM&#95;L im Rahmen von medizindidaktischen Angeboten des<Mark2> Kompetenzzentrums f&#252;r Hochschuldidaktik in der Medizin Baden-W&#252;rttemberg in T&#252;bingen</Mark2> erprobt.</Pgraph><SubHeadline2>Stichprobe</SubHeadline2><Pgraph>Den Analysen lagen die Daten von zwei Gruppen von Teilnehmerinnen und Teilnehmern medizindidaktischer Kurse des <Mark2>Kompetenzzentrums f&#252;r Hochschuldidaktik in der Medizin Baden- W&#252;rttemberg</Mark2> zugrunde. Diese kompetenzorientiert gestalteten Kurse <TextLink reference="22"></TextLink> wurden an verschiedenen baden-w&#252;rttembergischen Fakult&#228;ten (Freiburg, Mannheim, T&#252;bingen) unter Einbezug von Teilnehmerinnen und Teilnehmern v.a. aus baden-w&#252;rttembergischen Fakult&#228;ten durchgef&#252;hrt. Im Wintersemester 2019&#47;2020 haben 29 Teilnehmerinnen und Teilnehmer der Kurse <Mark2>Medizindidaktische Qualifikation I</Mark2> (MQ I, Basisqualifikation) und 12 der Kurse <Mark2>Medizindidaktische Qualifikation II</Mark2> (MQ II, Aufbauqualifikation) den FKM&#95;L freiwillig ausgef&#252;llt. Im Wintersemester 2020&#47;2021 und Sommersemester waren es 49 Personen, die den FKM&#95;L im Rahmen ihrer Teilnahme an den <Mark2>Medizindidaktischen Qualifikationskursen I</Mark2> bearbeitet haben.</Pgraph><Pgraph>Wegen der kleinen Kursgr&#246;&#223;en haben wir aus Datenschutzgr&#252;nden zun&#228;chst auf eine systematische Erfassung der Angaben zu Alter und Geschlecht verzichtet. Bei sp&#228;teren Erhebungen wurden diese Informationen auf freiwilliger Basis zusammen mit den Einverst&#228;ndniserkl&#228;rungen eingeholt. Es liegen daher von nur 50 Personen n&#228;here Angaben zu Geschlecht und Alter vor. Zum Zeitpunkt der Befragung waren diese im Mittel 37 Jahre (SD&#61;5.95, Md&#61;35, Mo&#61;33) alt, 41&#37; waren Frauen. </Pgraph><Pgraph>Der FKM&#95;L wird unmittelbar zu Beginn der Kurse (v.a. MQ I) als didaktisches Mittel mit dem Ziel der Einf&#252;hrung in die Thematik Kompetenzen und zur Reflexion der Auspr&#228;gungen der eigenen Lehrkompetenzen eingesetzt. Zu sp&#228;teren Zeitpunkten im Kurs oder in der anschlie&#223;enden Aufbaustufe werden weitere Standortbestimmungen durchgef&#252;hrt. Um individuelle Entwicklungen im Zeitverlauf erfassen zu k&#246;nnen, k&#246;nnen reproduzierbare anonyme Codes f&#252;r die Befragten verwendet werden.</Pgraph><SubHeadline2>Statistische Analysen</SubHeadline2><Pgraph>Im Rahmen von Itemanalysen nach dem Konzept der sog. <Mark2>Klassischen Testtheorie</Mark2> wurden f&#252;r jedes Item Trennsch&#228;rfe und Schwierigkeit berechnet. Als Ma&#223; der inneren Konsistenz wurde f&#252;r jede Kompetenz-Skala zudem Cronbach&#39;s &#945; (CR-&#945;) ermittelt.</Pgraph><Pgraph>Das Konzept der Schwierigkeit von Items wurde urspr&#252;nglich im Zusammenhang der Konstruktion von Leistungstests eingef&#252;hrt. Die Itemschwierigkeit wird dabei mit Hilfe des sog. Schwierigkeitsindex gesch&#228;tzt. Dieser ist definiert als der Prozentsatz der Getesteten, der eine Testaufgabe bzw. ein Testitem l&#246;st <TextLink reference="23"></TextLink>. Hierbei ist zu beachten, dass ein numerisch hoher Wert des Schwierigkeitsindex anzeigt, dass die betreffende Aufgabe bzw. das betreffende Item &#8222;leicht&#8220; ist, da ein hoher Prozentsatz der Befragten sie l&#246;sen konnte. Entsprechend zeigt ein numerischer niedriger Schwierigkeitsindex das Vorliegen eines &#8222;schwierigen&#8220; Items an, insofern dieses nur von einem geringen Prozentsatz der Getesteten gel&#246;st werden konnte. Um die Schwierigkeit von Items aus Selbsteinsch&#228;tzungsfrageb&#246;gen mit mehrfach abgestuften Antwortm&#246;glichkeiten wie im hier vorliegenden Fall bestimmen zu k&#246;nnen, kann in Anlehnung an D&#246;ring und Bortz <TextLink reference="24"></TextLink> zur Berechnung des Schwierigkeitsindex die folgende Formel herangezogen werden: (M<Subscript>i</Subscript> &#8211; 1 &#47; k &#8211; 1) &#42; 100. Dabei bezeichnet M<Subscript>i</Subscript> den Mittelwert des fraglichen Items und k die Anzahl der &#8211; beginnend mit 1 kontinuierlich kodierten &#8211; Stufen der Antwortskala.</Pgraph><Pgraph>Trennsch&#228;rfekoeffizienten geben an, wie hoch ein Item mit dem Gesamtwert der zugeh&#246;rigen Skala korreliert bzw. wie gut ein Item das von der Skala zu erfassende Konstrukt misst <TextLink reference="24"></TextLink>. Trennsch&#228;rfen &#60;.30 werden als niedrig eingestuft <TextLink reference="25"></TextLink>. Als &#8222;mittlere&#8220; Trennsch&#228;rfen gelten Werte zwischen .30 und .50, Werte gr&#246;&#223;er als .50 als hohe Trennsch&#228;rfen.</Pgraph><Pgraph>Zwischen Trennsch&#228;rfe und Schwierigkeit besteht eine paraboloide Beziehung <TextLink reference="23"></TextLink>, d.h. bei geringer Schwierigkeit eines Items ist auch die Trennsch&#228;rfe gering, bei einer mittleren Schwierigkeit von 50&#37; erreicht die Trennsch&#228;rfe ihr Maximum, danach nimmt bei steigender Schwierigkeit die Trennsch&#228;rfe wieder ab. Nach Lienert <TextLink reference="23"></TextLink> bedeutet mittlere Schwierigkeit jedoch nicht zwangsl&#228;ufig eine gute Trennsch&#228;rfe.</Pgraph><Pgraph>Zur Beurteilung der Reliabilit&#228;t werden im Allgemeinen folgende Wertegrenzen f&#252;r CR-&#945; herangezogen: hohe Reliabilit&#228;t &#62;.90 und niedrige Reliabilit&#228;t &#60;.80. Diese Gr&#246;&#223;en sind jedoch kontextabh&#228;ngig und sollten daher nicht zu starr angewandt werden <TextLink reference="24"></TextLink>, <TextLink reference="25"></TextLink>.</Pgraph><Pgraph>Die statistischen Auswertungen erfolgten mit Hilfe des Statistikprogramms SPSS, Version 26.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Results">
      <MainHeadline>Results</MainHeadline><SubHeadline2>Item analyses</SubHeadline2><Pgraph>The scale scores determined for the individuals represent sum values that were divided by the number of items in a scale. Accordingly, both the scale scores of the individuals and the means of the scales calculated for the groups can vary between 1 and 5. A high scale score thus means a high level of self-assessed competence in relation to the respective competence field (see table 3 <ImgLink imgNo="3" imgType="table"/>).</Pgraph><Pgraph>As shown in table 3 <ImgLink imgNo="3" imgType="table"/>, all 22 subscales formed from the in-depth items show internal consistencies above CR-&#945;&#61;.70. Since it is generally recommended to form scales with at least three items, one item was added to the subscale MH04 of the competence domain <Mark2>Didactical Activities in Medicine</Mark2> from WS 2020&#47;2021. This led to an increase in the discriminatory power of the items and the reliability of this subscale.</Pgraph><Pgraph>Corrected part-whole correlations between items and their respective scale and difficulty indices were calculated for the items of all subscales. In addition, the mean of the difficulty indices was determined for each subscale. All corrected part-whole correlations are &#62;.30. Concerning the difficulty indices, the results show that for two competency domains one subscale each (LO01, PH02) has a mean difficulty index of &#62;80&#37;, i.e. the respective subscales contain rather easy items. In two other competence areas there are also subscales including items with difficulty indices of up to 25&#37; (SL02, RW03), i.e. they are to be regarded as rather difficult.</Pgraph><Pgraph>Further results, which are not presented in detail here, show that the global items, with two exceptions, always correlate most highly and significantly with the subscales assigned to these items. However, similarly high significant correlations are also found with subscales of other competency domains. The correlations of the global items with the associated subscales shown in table 3 <ImgLink imgNo="3" imgType="table"/> range from r&#61;.32 to r&#61;.80.</Pgraph><Pgraph>A comparison of the mean scores for the global and subscales presented in table 3 <ImgLink imgNo="3" imgType="table"/> shows that the competence domains differ with regard to the level of competence respectively.</Pgraph><SubHeadline2>Intercorrelations of the overall scales</SubHeadline2><Pgraph>The overall scales of the FKM&#95;L correlate moderately to highly with each other (see table 4 <ImgLink imgNo="4" imgType="table"/>). The highest correlations exist between the overall scale <Mark2>Social and Communicative Competence</Mark2> (KK) and the overall scale <Mark2>Student Centred Learning</Mark2> (LO) as well as between the overall scale <Mark2>Reflection and Further Development of Own Teaching Practice</Mark2> (RW) and the overall <Mark2>System-based Teaching and Learning</Mark2> (SL) scale.</Pgraph><SubHeadline2>Examples of evaluations </SubHeadline2><Pgraph>To illustrate, figure 1 <ImgLink imgNo="1" imgType="figure"/> shows scale scores of the total scales of the six competency domains for each of three randomly selected participants of the MQ I and MQ II courses. Differences between the scale scores can be seen both within and between the competence fields. With one exception, the scale scores of the participants in the MQ II course are all above the scale scores of the participants in the MQ I courses. Accordingly, an analysis of the group means reveals significant differences between the courses for four of the six overall scales.</Pgraph><Pgraph>The illustration of the subscale scores for the three randomly selected participants of the MQ I courses for the competence domain<Mark2> Social and Communicative Competence</Mark2> (see figure 2 <ImgLink imgNo="2" imgType="figure"/>) shows intraindividual and interindividual competence level differences within this competence domain. In the context of counselling events, it can be useful to look at differences of an individual within a subskill at the single-item level. This can be demonstrated by the example of subscale KK04 on constructive feedback for person MQ I&#95;3, who ticked the three items of this scale as follows:</Pgraph><Pgraph>&#8220;1&#8221; You follow common feedback rules when giving feedback.</Pgraph><Pgraph>&#8220;3&#8221; You recognize and use appropriate times for feedback discussions.</Pgraph><Pgraph>&#8220;1&#8221; You know and use various feedback tools.</Pgraph><Pgraph>These statements may indicate that the person already holds feedback discussions in his or her (teaching) practice, but so far has no knowledge of feedback rules and feedback instruments. In a post-course survey, one would expect these items to be rated more strongly as true. However, a reliable interpretation of such differences requires the determination of appropriate confidence intervals.</Pgraph><Pgraph> </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><SubHeadline2>Itemanalysen</SubHeadline2><Pgraph>Die f&#252;r die Personen ermittelten Skalenwerte stellen Summenwerte dar, die durch die Anzahl der Items einer Skala dividiert wurden. Entsprechend k&#246;nnen sowohl die Skalenwerte der Personen als auch die f&#252;r die Gruppen berechneten Mittelwerte der Skalen zwischen 1 und 5 variieren. Ein hoher Skalenwert bedeutet somit eine hohe Auspr&#228;gung der selbsteingesch&#228;tzten Kompetenz in Bezug auf das jeweilige Kompetenzfeld (siehe Tabelle 3 <ImgLink imgNo="3" imgType="table"/>).</Pgraph><Pgraph>Wie aus Tabelle 3 <ImgLink imgNo="3" imgType="table"/> hervorgeht, weisen alle 22 aus den vertiefenden Items gebildeten Subskalen Ma&#223;e der inneren Konsistenz auf, die &#252;ber CR-&#945;&#61;.70 liegen. Da allgemein empfohlen wird, Skalen mit mindestens drei Items zu bilden, wurde ab WS 2020&#47;2021 die Subskala MH04 des Kompetenzfeldes Medizindidaktisches Handeln um ein Item erg&#228;nzt. Dies f&#252;hrte zu einer Erh&#246;hung der Trennsch&#228;rfen und der Reliabilit&#228;t dieser Subskala.</Pgraph><Pgraph>F&#252;r die Items aller Subskalen wurden (part-whole korrigierte) Trennsch&#228;rfen und Schwierigkeitsindices berechnet. Dar&#252;ber hinaus wurde pro Subskala jeweils der Mittelwert der Schwierigkeitsindices bestimmt. Die Trennsch&#228;rfen sind alle &#62;.30. Bez&#252;glich der Schwierigkeitsindices zeigen die Ergebnisse, dass f&#252;r zwei Kompetenzfelder jeweils eine Subskala (LO01, PH02) einen mittleren Schwierigkeitsindex von &#62;80&#37; aufweist, die betreffenden Subskalen also eher leichte Items beinhalten. Bei zwei weiteren Kompetenzfeldern finden sich zudem Subskalen, deren Items Schwierigkeitsindices von bis zu 25&#37; (SL02, RW03) aufweisen, also eher als schwierig anzusehen sind.</Pgraph><Pgraph>Weitere hier nicht n&#228;her dargestellte Ergebnisse zeigen, dass die Globalitems, von zwei Ausnahmen abgesehen, immer am h&#246;chsten und signifikant mit den diesen Items zugeordneten Subskalen korrelieren. Es finden sich jedoch auch &#228;hnlich hohe signifikante Zusammenh&#228;nge mit Subskalen anderer Kompetenzfelder. Die in Tabelle 3 <ImgLink imgNo="3" imgType="table"/> dargestellten Korrelationen der Globalitems mit den dazugeh&#246;rigen Subskalen liegen zwischen r&#61;.32 und r&#61;.80.</Pgraph><Pgraph>Ein Vergleich der in Tabelle 3 <ImgLink imgNo="3" imgType="table"/> dargestellten Mittelwerte f&#252;r die Gesamt- und Subskalen zeigt, dass die Kompetenzfelder sich im Hinblick auf das jeweils vorhandene Kompetenzniveau unterscheiden.</Pgraph><SubHeadline2>Interkorrelationen der Gesamtskalen</SubHeadline2><Pgraph>Die Gesamtskalen des FKM&#95;L korrelieren moderat bis hoch miteinander (siehe Tabelle 4 <ImgLink imgNo="4" imgType="table"/>). Die h&#246;chsten Korrelationen bestehen zwischen der Gesamtskala <Mark2>Kommunikative Kompetenz</Mark2> (KK) und der Gesamtskala <Mark2>Lernorientierung</Mark2> (LO) sowie zwischen der Gesamtskala <Mark2>Reflexion und Weiterentwicklung der eigenen Lehrpraxis</Mark2> (RW) und der Gesamtskala <Mark2>Systembezogenes Lehren und Lernen</Mark2> (SL).</Pgraph><SubHeadline2>Auswertungsbeispiele </SubHeadline2><Pgraph>In Abbildung 1 <ImgLink imgNo="1" imgType="figure"/> sind jeweils f&#252;r drei zuf&#228;llig ausgew&#228;hlte Teilnehmerinnen und Teilnehmer der MQ I und MQ II-Kurse exemplarisch die Skalenwerte der Gesamtskalen der sechs Kompetenzfelder dargestellt. Unterschiede zwischen den Skalenwerten sind sowohl innerhalb als auch zwischen den Kompetenzfeldern zu erkennen. Die Skalenwerte der Teilnehmerinnen und Teilnehmer des MQ II-Kurses liegen bis auf eine Ausnahme alle &#252;ber den Skalenwerten der Teilnehmerinnen und Teilnehmer der MQ I-Kurse. Eine Analyse der Gruppenmittelwerte ergibt dementsprechend f&#252;r vier der sechs Gesamtskalen signifikante Unterschiede zwischen den Kursen.</Pgraph><Pgraph>Die exemplarische Darstellung der Subskalenwerte f&#252;r die drei zuf&#228;llig ausgew&#228;hlten Teilnehmerinnen und Teilnehmer der MQ I-Kurse f&#252;r das Kompetenzfeld <Mark2>Soziale und Kommunikative Kompetenz</Mark2> (siehe Abbildung 2 <ImgLink imgNo="2" imgType="figure"/>) zeigt intraindividuelle und interindividuelle Kompetenzniveauunterschiede innerhalb dieses Kompetenzfeldes. Im Rahmen von Beratungsanl&#228;ssen kann es sinnvoll sein, Unterschiede einer Person innerhalb einer Teilkompetenz auf Einzelitemebene zu betrachten. Dies l&#228;sst sich am Beispiel der Subskala KK04 zum konstruktiven Feedback f&#252;r die Person MQ I&#95;3 veranschaulichen, die die drei Items dieser Skala wie folgt angekreuzt hat:</Pgraph><Pgraph>&#8222;1&#8220; Sie orientieren sich bei R&#252;ckmeldungen an g&#228;ngigen Feedbackregeln.</Pgraph><Pgraph>&#8222;3&#8220; Sie erkennen und nutzen passende Zeitpunkte f&#252;r Feedbackgespr&#228;che.</Pgraph><Pgraph>&#8222;1&#8220; Sie kennen und nutzen verschiedene Feedbackinstrumente.</Pgraph><Pgraph>Diese Angaben k&#246;nnen darauf verweisen, dass die Person zwar in ihrer (Lehr-)Praxis bereits Feedbackgespr&#228;che f&#252;hrt, bislang jedoch noch keine Kenntnisse von Feedbackregeln und Feedbackinstrumenten hat. Bei einer nach dem Kurs durchgef&#252;hrten Befragung w&#252;rde man erwarten, dass diese Items st&#228;rker als zutreffend eingesch&#228;tzt werden. Eine zuverl&#228;ssige Interpretation solcher Unterschiede setzt jedoch die Bestimmung geeigneter Konfidenzintervalle voraus.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Discussion">
      <MainHeadline>Discussion</MainHeadline><Pgraph>The analyses of psychometric properties of the FKM&#95;L yielded mostly satisfactory results. In the following, the results are discussed separately for the subscales, overall scales, and global items as well as for the examples of evaluations. </Pgraph><SubHeadline2>Subscales</SubHeadline2><Pgraph>For each of the six competence areas, three to four subscales were formed to capture sub- competencies. Since internal consistencies between CR-&#945;&#61;.60 and CR-&#945;&#61;.70 are considered sufficient for group comparisons <TextLink reference="23"></TextLink>, <TextLink reference="26"></TextLink> and reliabilities of CR-&#945;&#61;.80 are considered good <TextLink reference="27"></TextLink>, the coefficients (CR-&#945;&#61;.71 to CR-&#945;&#61;.93) obtained for the 22 subscales are in an acceptable to good range.</Pgraph><Pgraph>The discriminatory power of an item shows how well the response to the item predicts the corresponding scale sum value <TextLink reference="24"></TextLink>. All the discriminatory power values determined for the subscales, with values between .34 and .91, are located in a consistently acceptable to satisfactory range. To determine whether a differentiation between persons with different levels of competence is possible with the individual items, difficulty indices were calculated for the items of the subscales. In addition, for each subscale the mean of the difficulty indices of their respective items was determined. According to D&#246;ring and Bortz <TextLink reference="24"></TextLink>, extremely difficult items (difficulty index &#60;20&#37;) as well as extremely easy items (difficulty index &#62;80&#37;) are to be regarded as providing little information on their ability to differentiate between respondents. The results show that the latter applies to one subscale each of the competence fields <Mark2>Student Centred Learning and Role Model and Professional Behaviour</Mark2>. A closer look at the items suggests that this is due to the fact that the items are phrased in a comparatively global way (e.g. &#8220;They value mutual respect&#8221;) and may possibly encourage self-serving answers. In three of the subscales, items have difficulty indices between 18&#37; and 25&#37;, i.e. only a maximum of 25 percent of the participants have ticked the items as applicable. Two of these subscales are assigned to the competence field of <Mark2>System-based Teaching and Learning</Mark2>, one subscale to the competence field of <TextGroup><Mark2>Reflection and Further Development of own Teaching</Mark2></TextGroup><Mark2> Practice</Mark2>. The relevant items of these subscales usually address active participation in the planning and implementation of the curriculum. However, the participants of the medical didactics courses are heterogeneous in many ways. The participants come from different subjects, are active in different positions and functions and have been able to gain experience in teaching for more or less time. It is thus understandable that they can assess the items described above as applicable to varying degrees depending on their background. The subscales with too easy or too difficult items can nevertheless be used as a didactic tool to reflect on the respective teaching competences. Nevertheless, further analysis should be conducted to possibly supplement and&#47;or reformulate the items of these subscales. Additional cognitive pre-tests might provide valuable clues as to how these items could be reworded.</Pgraph><SubHeadline2>Overall scales (core competencies)</SubHeadline2><Pgraph>For each competence domain of the FKM&#95;L, the items of the subscales were combined into overall scales. These overall scales show consistently good internal consistencies, which is understandable since an extension of scales with additional items usually leads to higher reliability <TextLink reference="23"></TextLink>. </Pgraph><Pgraph>The FKM&#95;L was developed based on the model of <Mark2>Core Competencies for Teachers in Medicine</Mark2>. Already during the development of this model, it was found that some sub-competencies and learning objectives could be assigned to different competence fields <TextLink reference="2"></TextLink>. Therefore, the moderate to high intercorrelations of the total scales can be explained well (see table 4 <ImgLink imgNo="4" imgType="table"/>). As determined from the correlations between the total scales, the proportions of their common variance (r<Superscript>2</Superscript>) ranged between .10 and .64. 13 of 15 of these proportions were &#60;.50, so that it can be assumed that the overall scales capture different facets of teaching competence. However, the very high intercorrelation between the overall scales <Mark2>Reflection and Further Development of own Teaching Practice</Mark2> (RW) and <Mark2>System-based Teaching and Learning</Mark2> (SL) suggests considering to either combine or shorten these two scales.</Pgraph><SubHeadline2>Global items</SubHeadline2><Pgraph>Most global items correlate significantly, as expected, although sometimes not substantially high (r&#62;.50) with their associated subscales (see table 3 <ImgLink imgNo="3" imgType="table"/>). In addition, global items of a respective competence domain often also correlate significantly and at comparable levels with the subscales of the other competence domains. This suggests that the global items have low discriminant validity, so that diagnostics on the level of the global items is currently not recommended. For this reason, but also in order to shorten response time and to avoid negative effects possibly associated with response load, these items were dispensed with from WS 2020&#47;2021 onward.</Pgraph><SubHeadline2>Examples of evaluations </SubHeadline2><Pgraph>With the examples of individual evaluations given, inter- and intra-individual differences in the competency characteristics are apparent. As a next step, comparison values of appropriate reference groups will be provided. However, this requires a broader data base.</Pgraph><SubHeadline2>Feedback on the questionnaire</SubHeadline2><Pgraph>The feedback of the participants of the different courses referred predominantly to the length of the questionnaire, i.e., to the number of items and the length of the wording of individual items. It was suggested on various occasions that the completion time should be increased to allow a more thorough assessment of one&#8217;s competencies. In addition, the use of terms not understandable without further prior information was criticized. The manner of presentation (especially the assignment of items to competencies vs. arbitrary arrangement; size of screen pages) was also addressed. Short additional information in the form of marginal notes on the reading of certain items was desired in order to make the assessments more reliable.</Pgraph><SubHeadline2>Validity</SubHeadline2><Pgraph>So far, steps have only been taken to ensure the content validity of the FKM&#95;L by taking the KLM model as the basis for development. Furthermore, the authors wrote and assigned the items by drawing on theoretical arguments <TextLink reference="24"></TextLink>, <TextLink reference="25"></TextLink>. However, a thorough examination of the construct and criterion validity of the instrument is still pending.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Die Analysen zur teststatischen &#220;berpr&#252;fung des FKM&#95;L erbrachten &#252;berwiegend zufriedenstellende Ergebnisse. Nachfolgend werden die Ergebnisse getrennt f&#252;r die Subskalen, Gesamtskalen, Globalfragen sowie f&#252;r die Auswertungsbeispiele diskutiert.</Pgraph><SubHeadline2>Subskalen</SubHeadline2><Pgraph>F&#252;r die sechs Kompetenzfelder wurden jeweils drei bis vier Subskalen gebildet, die Teilkompetenzen erfassen. Ausgehend davon, dass Ma&#223;e der inneren Konsistenz zwischen CR-&#945;&#61;.60 und CR-&#945;&#61;.70 als ausreichend f&#252;r Gruppenvergleiche <TextLink reference="23"></TextLink>, <TextLink reference="26"></TextLink> angesehen werden und Reliabilit&#228;ten von CR-&#945;&#61;.80 als gut gelten <TextLink reference="27"></TextLink>, liegen die ermittelten Koeffizienten (CR-&#945;&#61;.71 bis CR-&#945;&#61;.93) der 22 Subskalen im akzeptablen bis guten Bereich.</Pgraph><Pgraph>Mit der Trennsch&#228;rfe eines Items wird aufgezeigt, wie gut mit der Beantwortung des Items der zugeh&#246;rige Skalensummenwert vorhergesagt wird <TextLink reference="24"></TextLink>. Alle f&#252;r die Subskalen ermittelten Trennsch&#228;rfen liegen mit Werten zwischen .34 und .91 in einem durchweg akzeptablen bis zufriedenstellenden Bereich. Um festzustellen, ob mit den einzelnen Items eine Differenzierung zwischen Personen mit unterschiedlichen Kompetenzauspr&#228;gungen m&#246;glich ist, wurden f&#252;r die Items der Subskalen Schwierigkeitsindices berechnet. Zudem wurde f&#252;r jede Subskala der Mittelwert der Schwierigkeitsindices ihrer Items ermittelt. Nach D&#246;ring und Bortz <TextLink reference="24"></TextLink>, sind extrem schwierige Items (Schwierigkeitsindex &#60;20&#37;) wie auch extrem leichte Items (Schwierigkeitsindex &#62;80&#37;) als wenig informativ hinsichtlich ihrer F&#228;higkeit zur Differenzierung zwischen den Befragten anzusehen. Die Auswertungen zeigen, dass Letzteres f&#252;r jeweils eine Subskala der Kompetenzfelder<Mark2> Lernerorientierung</Mark2> und <Mark2>Rollenvorbild und Professionelles Handeln</Mark2> zutrifft. Eine n&#228;here Betrachtung der Items l&#228;sst vermuten, dass dies dadurch zustande kommt, dass die Items vergleichsweise global formuliert sind (z.B. &#8222;Sie legen Wert auf gegenseitigen Respekt&#8220;) und eventuell zu selbstwertdienlichen Antworten animieren k&#246;nnen. Bei drei der Subskalen weisen Items Schwierigkeitsindices zwischen 18&#37; und 25&#37; auf, d.h. dass diese nur von maximal 25 Prozent der Personen als zutreffend eingesch&#228;tzt wurden. Zwei dieser Subskalen sind dem <Mark2>Kompetenzfeld Systembezogenes Lehren und Lernen</Mark2> zuzuordnen, eine Subskala dem <Mark2>Kompetenzfeld Reflexion und Weiterentwicklung der eigenen Lehrpraxis</Mark2>. Die betreffenden Items dieser Subskalen thematisieren in der Regel eine aktive Beteiligung an der Planung und Umsetzung des Curriculums. Die Teilnehmerstruktur der medizindidaktischen Kurse ist allerdings heterogen. Die Teilnehmerinnen und Teilnehmer kommen aus verschiedenen F&#228;chern, sind in unterschiedlichen Positionen und Funktionen t&#228;tig und haben mehr oder weniger lange Erfahrungen in der Lehre sammeln k&#246;nnen. Damit ist nachvollziehbar, dass sie die oben beschriebenen Items je nach Hintergrund in unterschiedlichem Ma&#223;e als zutreffend einsch&#228;tzen k&#246;nnen. Die Subskalen mit den zu leichten bzw. zu schwierigen Items k&#246;nnen dennoch zur Reflexion der jeweiligen Lehrkompetenzen als didaktisches Mittel eingesetzt werden. Dennoch sollten weitere Analysen durchgef&#252;hrt werden, um die Items dieser Subskalen eventuell zu erg&#228;nzen und&#47;oder umzuformulieren. Erg&#228;nzende kognitive Pretests k&#246;nnen wertvolle Hinweise liefern, wie diese Items umformuliert werden k&#246;nnten.</Pgraph><SubHeadline2>Gesamtskalen (Kernkompetenzen)</SubHeadline2><Pgraph>F&#252;r jedes Kompetenzfeld des FKM&#95;L wurden die Items der Subskalen zu Gesamtskalen zusammengefasst. Diese Gesamtskalen weisen durchgehend gute innere Konsistenzen auf, was nachvollziehbar ist, da eine Verl&#228;ngerung von Skalen mit zus&#228;tzlichen Items i.d.R. zu h&#246;heren Reliabilit&#228;ten f&#252;hrt <TextLink reference="23"></TextLink>.</Pgraph><Pgraph>Der FKM&#95;L wurde auf der Basis des Modells <Mark2>Kernkompetenzen f&#252;r Lehrkr&#228;fte in der Medizin</Mark2> entwickelt. Bereits bei der Entwicklung dieses Modells wurde festgestellt, dass einige Teilkompetenzen und Lernziele verschiedenen Kompetenzfeldern zuordenbar waren <TextLink reference="2"></TextLink>. Von daher lassen sich die moderaten bis hohen Interkorrelationen der Gesamtskalen gut erkl&#228;ren (siehe Tabelle 4 <ImgLink imgNo="4" imgType="table"/>). Die aus den Korrelationen zu ermittelnden gemeinsamen Varianzanteile (r<Superscript>2</Superscript>) der Gesamtskalen liegen zwischen .10 und .64. 13 von 15 dieser gemeinsamen Varianzanteile sind &#60;.50, so dass durchaus davon auszugehen ist, dass die Gesamtskalen unterschiedliche Facetten der Lehrkompetenz erfassen. Die sehr hohe Interkorrelation zwischen den Gesamtskalen <Mark2>Reflexion und Weiterentwicklung der eigenen Lehrpraxis</Mark2> (RW) und <Mark2>Systembezogenes Lehren und Lernen</Mark2> (SL) gibt jedoch Anlass zu &#252;berlegen, inwieweit hier eine Zusammenlegung oder K&#252;rzungen sinnvoll sind.</Pgraph><SubHeadline2>Globalitems</SubHeadline2><Pgraph>Die meisten Globalitems korrelieren zwar erwartungsgem&#228;&#223; signifikant, jedoch nicht immer substanziell hoch (r&#62;.50) mit den ihnen zugeh&#246;rigen Subskalen (siehe Tabelle 3 <ImgLink imgNo="3" imgType="table"/>). Zudem korrelieren Globalitems eines jeweiligen Kompetenzfeldes h&#228;ufig auch mit den Subskalen der anderen Kompetenzfelder signifikant und in vergleichbarer H&#246;he. Dies legt nahe, dass die Globalitems eine geringe diskriminante Validit&#228;t aufweisen, so dass eine Diagnostik auf Ebene der Globalitems zurzeit nicht zu empfehlen ist. Aus diesem Grund, aber auch um die Beantwortungszeit zu verk&#252;rzen und mit dem Aufwand m&#246;glicherweise verbundene negative Effekte zu vermeiden, wurde auf die zus&#228;tzliche Erfassung dieser Items ab WS 2020&#47;2021 verzichtet.</Pgraph><SubHeadline2>Auswertungsbeispiele</SubHeadline2><Pgraph>Mit den exemplarischen Einzelauswertungen sind inter- und intraindividuelle Unterschiede in den Kompetenzauspr&#228;gungen erkennbar. Die n&#228;chsten Schritte sehen die Ermittlung von Vergleichswerten der jeweiligen Bezugsgruppen vor. Hierzu ist jedoch eine breitere Datenbasis erforderlich.</Pgraph><SubHeadline2>Feedback zum Fragebogen</SubHeadline2><Pgraph>Die R&#252;ckmeldungen der Teilnehmerinnen und Teilnehmer der verschiedenen Kurse bezogen sich &#252;berwiegend auf den Umfang des Fragebogens, d.h. auf die Anzahl der Items und die L&#228;nge der Formulierung einzelner Items. Verschiedentlich wurde angeregt, die Bearbeitungszeit zu erh&#246;hen, da diese f&#252;r die detaillierte Kompetenzerfassung nicht ausreichend sei. Dar&#252;ber hinaus wurde die Verwendung von Begriffen kritisiert, die nicht ohne weitere Vorinformation verst&#228;ndlich sind. Auch die Art der Darbietung (v.a. Zuordnung von Items zu Kompetenzen vs. willk&#252;rliche Anordnung; Aufteilung auf Bildschirmseiten) wurde angesprochen. Gew&#252;nscht wurden kurze Zusatzinformationen in Form von Randnotizen zur Lesart bestimmter Items, um die Einsch&#228;tzungen verl&#228;sslicher zu machen.</Pgraph><SubHeadline2>Validit&#228;t</SubHeadline2><Pgraph>Bislang wurden lediglich Schritte unternommen, um die Inhaltsvalidit&#228;t des FKM&#95;L zu sichern, indem der Entwicklung das KLM-Modells zugrunde gelegt wurde und die Autorinnen und der Autor die Formulierung und Zuordnung der Items theoretisch-argumentativ vornahmen <TextLink reference="24"></TextLink>, <TextLink reference="25"></TextLink>. Eine eingehende &#220;berpr&#252;fung der Konstrukt- und der Kriteriumsvalidit&#228;t des Verfahrens steht jedoch noch aus.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Conclusion">
      <MainHeadline>Conclusion</MainHeadline><Pgraph>In summary, based on the presented results, the FKM&#95;L can already be used for individual and group diagnostics despite slight limitations: Teachers can use their FKM&#95;L profiles to decide whether they want to review or optimize their competency characteristics in one respect or another, and faculty developers can use the FKM&#95;L as a screening tool to identify participants&#39; needs and gaps in their qualification offerings. In addition, the assessment of competencies and their results can be used as a didactic tool in medical didactic courses, e.g., to raise awareness and reflect on individual teaching competencies and their development needs.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Fazit">
      <MainHeadline>Fazit</MainHeadline><Pgraph>Zusammenfassend betrachtet, kann der FKM&#95;L anhand der beschriebenen Ergebnisse trotz leichter Einschr&#228;nkungen bereits jetzt zur Individual- und Gruppendiagnostik eingesetzt werden: Lehrende k&#246;nnen anhand ihrer FKM&#95;L-Profile entscheiden, ob sie an der einen oder anderen Stelle ihre erfassten Kompetenzauspr&#228;gungen &#252;berpr&#252;fen bzw. optimieren m&#246;chten, und Faculty Development-Anbieter k&#246;nnen den FKM&#95;L als Screening-Instrument verwenden, um die Bedarfe der Teilnehmerinnen und Teilnehmer sowie L&#252;cken im Qualifikationsangebot zu ermitteln. Dar&#252;ber hinaus k&#246;nnen die Erfassung von Kompetenzen und deren Ergebnisse im Rahmen medizindidaktischer Kurse als didaktisches Mittel eingesetzt werden, beispielsweise zur Bewusstmachung und Reflexion von individuellen Lehrkompetenzen und deren Entwicklungsbedarf.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Funding">
      <MainHeadline>Funding</MainHeadline><Pgraph>The study was conducted within the context of the BMBF-funded joint project MER<Mark2>LIN</Mark2> (Medical Education Research &#8211;<Mark2> Lehrforschung im Netz BW</Mark2>) of the medical faculties of Freiburg, Heidelberg, Mannheim, Ulm and T&#252;bingen under the leadership of the Freiburg and T&#252;bingen sites. Grant number T&#220;: 01PL17011A, FR: 01PL17011B</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="F&#246;rderung">
      <MainHeadline>F&#246;rderung</MainHeadline><Pgraph>Die Studie wurde im Rahmen des BMBF-gef&#246;rderten Verbundprojekts MER<Mark2>LIN</Mark2> (Medical Education Research &#8211; Lehrforschung im Netz BW) der Medizinischen Fakult&#228;ten Freiburg, Heidelberg, Mannheim, Ulm und T&#252;bingen unter Federf&#252;hrung der Standorte Freiburg und T&#252;bingen durchgef&#252;hrt. F&#246;rderzeichen T&#220;: 01PL17011A, FR: 01PL17011B</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autor&#42;innen erkl&#228;ren, dass sie keinen Interessenkonflikt im Zusammenhang mit diesem Artikel haben.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Bromme R</RefAuthor>
        <RefTitle>Kompetenzen, Funktionen und unterrichtliches Handeln des Lehrers</RefTitle>
        <RefYear>1997</RefYear>
        <RefBookTitle>Enzyklop&#228;die der Psychologie. Psychologie des Unterrichts und der Schule</RefBookTitle>
        <RefPage>177-212</RefPage>
        <RefTotal>Bromme R. Kompetenzen, Funktionen und unterrichtliches Handeln des Lehrers. In: Weinert FE, editor. Enzyklop&#228;die der Psychologie. Psychologie des Unterrichts und der Schule. G&#246;ttingen: Hogrefe; 1997. p.177-212.</RefTotal>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>G&#246;rlitz A</RefAuthor>
        <RefAuthor>Ebert T</RefAuthor>
        <RefAuthor>Bauer D</RefAuthor>
        <RefAuthor>Grasl M</RefAuthor>
        <RefAuthor>Hofer M</RefAuthor>
        <RefAuthor>Lammerding-K&#246;ppel M</RefAuthor>
        <RefAuthor>Fabry G</RefAuthor>
        <RefTitle>Core Competencies for Medical Teachers (KLM) &#8211; A Position Paper of the GMA Committee on Personal and Organizational Development in Teaching</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefPage>Doc23</RefPage>
        <RefTotal>G&#246;rlitz A, Ebert T, Bauer D, Grasl M, Hofer M, Lammerding-K&#246;ppel M, Fabry G. Core Competencies for Medical Teachers (KLM) &#8211; A Position Paper of the GMA Committee on Personal and Organizational Development in Teaching. GMS Z Med Ausbild. 2015;32(2):Doc23. DOI: 10.3205&#47;zma000965</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3205&#47;zma000965</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Lipowsky F</RefAuthor>
        <RefTitle>Auf den Lehrer kommt es an. Empirische Evidenzen f&#252;r Zusammenh&#228;nge zwischen Lehrerkompetenzen, Lehrerhandeln und dem Lernen der Sch&#252;ler</RefTitle>
        <RefYear>2006</RefYear>
        <RefBookTitle>Kompetenzen und Kompetenzentwicklung von Lehrerinnen und Lehrern: Ausbildung und Beruf</RefBookTitle>
        <RefPage>47-70</RefPage>
        <RefTotal>Lipowsky F. Auf den Lehrer kommt es an. Empirische Evidenzen f&#252;r Zusammenh&#228;nge zwischen Lehrerkompetenzen, Lehrerhandeln und dem Lernen der Sch&#252;ler. In: Allemann-Ghionda C, Terhart E, editors. Kompetenzen und Kompetenzentwicklung von Lehrerinnen und Lehrern: Ausbildung und Beruf. Weinheim: Beltz; 2006. p.47-70.</RefTotal>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Srinivasan M</RefAuthor>
        <RefAuthor>T Li ST</RefAuthor>
        <RefAuthor>Meyers FJ</RefAuthor>
        <RefAuthor>Pratt DD</RefAuthor>
        <RefAuthor>Collins JB</RefAuthor>
        <RefAuthor>Braddock C</RefAuthor>
        <RefAuthor>Hilty DM</RefAuthor>
        <RefTitle>&#34;Teaching as a Competency&#34;: competencies for medical educators</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>1211-1220</RefPage>
        <RefTotal>Srinivasan M, T Li ST, Meyers FJ, Pratt DD, Collins JB, Braddock C, Hilty DM. &#34;Teaching as a Competency&#34;: competencies for medical educators. Acad Med. 2011;86(10):1211-1220. DOI: 10.1097&#47;ACM.0b013e31822c5b9a 13</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0b013e31822c5b9a 13</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Braun E</RefAuthor>
        <RefAuthor>Athanassios G</RefAuthor>
        <RefAuthor>Pollerhof K</RefAuthor>
        <RefAuthor>Schwabe U</RefAuthor>
        <RefTitle>Wie lassen sich kommunikative Kompetenzen messen&#63; Konzeption einer kompetenzorientierten Pr&#252;fung kommunikativer F&#228;higkeiten von Studierende</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Beitr Hochschulforsch</RefJournal>
        <RefPage>34-55</RefPage>
        <RefTotal>Braun E, Athanassios G, Pollerhof K, Schwabe U. Wie lassen sich kommunikative Kompetenzen messen&#63; Konzeption einer kompetenzorientierten Pr&#252;fung kommunikativer F&#228;higkeiten von Studierende. Beitr Hochschulforsch. 2018;40(3):34-55. Zug&#228;nglich unter&#47;available from: https:&#47;&#47;www.fachportal-paedagogik.de&#47;literatur&#47;vollanzeige.html&#63;FId&#61;1148973</RefTotal>
        <RefLink>https:&#47;&#47;www.fachportal-paedagogik.de&#47;literatur&#47;vollanzeige.html&#63;FId&#61;1148973</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Braun E</RefAuthor>
        <RefAuthor>Gusy B</RefAuthor>
        <RefAuthor>Leidner B</RefAuthor>
        <RefAuthor>Hannover B</RefAuthor>
        <RefTitle>Das Berliner Evaluationsinstrument f&#252;r selbsteingesch&#228;tzte, studentische Kompetenzen (BEvaKomp)</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Diagnostica</RefJournal>
        <RefPage>30-43</RefPage>
        <RefTotal>Braun E, Gusy B, Leidner B, Hannover B. Das Berliner Evaluationsinstrument f&#252;r selbsteingesch&#228;tzte, studentische Kompetenzen (BEvaKomp). Diagnostica. 2008;54(1):30-43. DOI: 10.1026&#47;0012-1924.54.1.30</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1026&#47;0012-1924.54.1.30</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Giesler M</RefAuthor>
        <RefAuthor>Forster J</RefAuthor>
        <RefAuthor>Biller S</RefAuthor>
        <RefAuthor>Fabry G</RefAuthor>
        <RefTitle>Entwicklung eines Fragebogens zur Erfassung von Kompetenzen in der Medizin: Ergebnisse zur Reliabilit&#228;t und Validit&#228;t</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefPage>Doc31</RefPage>
        <RefTotal>Giesler M, Forster J, Biller S, Fabry G. Entwicklung eines Fragebogens zur Erfassung von Kompetenzen in der Medizin: Ergebnisse zur Reliabilit&#228;t und Validit&#228;t. GMS Z Med Ausbild. 2011;28(2):Doc31. DOI: 10.3205&#47;zma000743</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3205&#47;zma000743</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Gollwitzer M</RefAuthor>
        <RefAuthor>J&#228;ger RS</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Evaluation &#8211; Workshop</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Gollwitzer M, J&#228;ger RS. Evaluation &#8211; Workshop. Weinheim: Beltz PVU; 2007.</RefTotal>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Jurecka A</RefAuthor>
        <RefTitle>Introduction of the Computer-Based Assessment of Competencies</RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Assessment of Competencies in Educational Contexts</RefBookTitle>
        <RefPage>193-213</RefPage>
        <RefTotal>Jurecka A. Introduction of the Computer-Based Assessment of Competencies. In: Hartig J,  Klieme E, Leutner D, editors. Assessment of Competencies in Educational Contexts. Bern: Hogrefe; 2008. p.193-213.</RefTotal>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Hartig J</RefAuthor>
        <RefTitle>Psychometric models for the assessment of competencies</RefTitle>
        <RefYear>2008</RefYear>
        <RefBookTitle>Assessment of Competencies in Educational Contexts</RefBookTitle>
        <RefPage>69-90</RefPage>
        <RefTotal>Hartig J. Psychometric models for the assessment of competencies. In: Hartig J, Klieme E, Leutner D, editors. Assessment of Competencies in Educational Contexts. Bern: Hogrefe; 2008. p.69-90.</RefTotal>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Wass V</RefAuthor>
        <RefAuthor>Vleuten van der C</RefAuthor>
        <RefAuthor>Shatzer J</RefAuthor>
        <RefAuthor>Jones R</RefAuthor>
        <RefTitle>Assessment of clinical competence</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>Lancet</RefJournal>
        <RefPage>945-949</RefPage>
        <RefTotal>Wass V, Vleuten van der C, Shatzer J, Jones R. Assessment of clinical competence. Lancet. 2001;357(9260):945-949. DOI: 10.1016&#47;S0140-6736(00)04221-5</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;S0140-6736(00)04221-5</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Eva KW</RefAuthor>
        <RefAuthor>Regehr G</RefAuthor>
        <RefTitle>Self-assessment in the health professions: a reformulation and research agenda</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>S46-54</RefPage>
        <RefTotal>Eva KW, Regehr G. Self-assessment in the health professions: a reformulation and research agenda. Acad Med. 2005;80(10 suppl):S46-54. DOI: 10.1097&#47;00001888-200510001-00015</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;00001888-200510001-00015</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Peterson LN</RefAuthor>
        <RefAuthor>Eva KW</RefAuthor>
        <RefAuthor>Rusticus SA</RefAuthor>
        <RefTitle>The readiness for Clerkship Survey: Can Self-assessment Data be used to evaluate Program Effectivness&#63;</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>1355-1360</RefPage>
        <RefTotal>Peterson LN, Eva KW, Rusticus SA. The readiness for Clerkship Survey: Can Self-assessment Data be used to evaluate Program Effectivness&#63; Acad Med. 2012;87(10):1355-1360. DOI: 10.1097&#47;ACM.0b013e3182676c76</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0b013e3182676c76</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Colthart I</RefAuthor>
        <RefAuthor>Bagnell G</RefAuthor>
        <RefAuthor>Evans A</RefAuthor>
        <RefAuthor>Allbutt H</RefAuthor>
        <RefAuthor>Haig A</RefAuthor>
        <RefAuthor>Illing J</RefAuthor>
        <RefAuthor>Mckinstry B</RefAuthor>
        <RefTitle>The effectiveness of self-assessment on the identification of learner needs, learner activity, and impact on clinical practice: BEME Guide no. 10</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>124-145</RefPage>
        <RefTotal>Colthart I, Bagnell G, Evans A, Allbutt H, Haig A, Illing J, Mckinstry B. The effectiveness of self-assessment on the identification of learner needs, learner activity, and impact on clinical practice: BEME Guide no. 10. Med Teach. 2008;30(2):124-145. DOI: 10.1080&#47;01421590701881699</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01421590701881699</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>J&#252;nger J</RefAuthor>
        <RefAuthor>Schellberg D</RefAuthor>
        <RefAuthor>Nikendei C</RefAuthor>
        <RefTitle>Subjektive Kompetenzeinsch&#228;tzung von Studierenden und ihre Leistung im OSCE</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>GMSZ Med Ausbild</RefJournal>
        <RefPage>Doc51</RefPage>
        <RefTotal>J&#252;nger J, Schellberg D, Nikendei C. Subjektive Kompetenzeinsch&#228;tzung von Studierenden und ihre Leistung im OSCE. GMSZ Med Ausbild. 2006;23(3):Doc51. Zug&#228;nglich unter&#47;available from: https:&#47;&#47;www.egms.de&#47;static&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000270.shtml</RefTotal>
        <RefLink>https:&#47;&#47;www.egms.de&#47;static&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000270.shtml</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Sieverding M</RefAuthor>
        <RefTitle>Frauen untersch&#228;tzen sich: Selbstbeurteilungs-Biases in einer simulierten Bewerbungssituation</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Z Sozialpsychol</RefJournal>
        <RefPage>147-160</RefPage>
        <RefTotal>Sieverding M. Frauen untersch&#228;tzen sich: Selbstbeurteilungs-Biases in einer simulierten Bewerbungssituation. Z Sozialpsychol. 2003;34(3):147-160. DOI: 10.1024&#47;&#47;0044-3514.34.3.147</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1024&#47;&#47;0044-3514.34.3.147</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Le&#243;n SP</RefAuthor>
        <RefAuthor>Vallejo AP</RefAuthor>
        <RefAuthor>Nelson JB</RefAuthor>
        <RefTitle>Variability in the accuracy of self-assessments among low, moderate, and high performing students in university education</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Pract Ass Res Evaln</RefJournal>
        <RefPage>Article 16</RefPage>
        <RefTotal>Le&#243;n SP, Vallejo AP, Nelson JB. Variability in the accuracy of self-assessments among low, moderate, and high performing students in university education. Pract Ass Res Evaln. 2021;26:Article 16. DOI: 10.7275&#47;6q91-az58</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.7275&#47;6q91-az58</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Bu&#223;enius L</RefAuthor>
        <RefAuthor>Harendza S</RefAuthor>
        <RefAuthor>van den Bussche H</RefAuthor>
        <RefAuthor>Selch S</RefAuthor>
        <RefTitle>Final-year medical students&#8217; self-assessment of facets of competence for beginning residents</RefTitle>
        <RefYear>2022</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>82</RefPage>
        <RefTotal>Bu&#223;enius L, Harendza S, van den Bussche H, Selch S. Final-year medical students&#8217; self-assessment of facets of competence for beginning residents. BMC Med Educ. 2022;22(1):82. DOI: 10.1186&#47;s12909-021-03039- 2</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-021-03039- 2</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Ehrlinger J</RefAuthor>
        <RefAuthor>Dunning D</RefAuthor>
        <RefTitle>How chronic selfviews influence (and potentially mislead) estimates of performance</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>J Pers Soc Psychol</RefJournal>
        <RefPage>5-17</RefPage>
        <RefTotal>Ehrlinger J, Dunning D. How chronic selfviews influence (and potentially mislead) estimates of performance. J Pers Soc Psychol. 2003;84(1): 5-17. DOI: 10.1037&#47;0022-3514.84.1.5</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;0022-3514.84.1.5</RefLink>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Regehr G</RefAuthor>
        <RefAuthor>Hodges B</RefAuthor>
        <RefAuthor>Tiberius R</RefAuthor>
        <RefAuthor>Lofchy J</RefAuthor>
        <RefTitle>Measuring self-assessment skills: An innovative relative ranking model</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>852-854</RefPage>
        <RefTotal>Regehr G, Hodges B, Tiberius R, Lofchy J. Measuring self-assessment skills: An innovative relative ranking model. Acad Med. 1996;71(10 Suppl):852-854. DOI: 10.1097&#47;00001888-199610000-00043</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;00001888-199610000-00043</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Schulz von Thun F</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1981</RefYear>
        <RefBookTitle>Miteinander reden 1: St&#246;rungen und Kl&#228;rungen. Allgemeine Psychologie der zwischenmenschlichen Kommunikation</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Schulz von Thun F. Miteinander reden 1: St&#246;rungen und Kl&#228;rungen. Allgemeine Psychologie der zwischenmenschlichen Kommunikation. 53. Auflage. Reinbek (bei Hamburg): Rowohlt-TB; 1981.</RefTotal>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Griewatz J</RefAuthor>
        <RefAuthor>Simon M</RefAuthor>
        <RefAuthor>Lammerding-Koeppel M</RefAuthor>
        <RefTitle>Competency-based teacher training: A systematic revision of a proven programme in medical didactics</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>GMS J Med Educ</RefJournal>
        <RefPage>Doc44</RefPage>
        <RefTotal>Griewatz J, Simon M, Lammerding-Koeppel M. Competency-based teacher training: A systematic revision of a proven programme in medical didactics. GMS J Med Educ. 2017;34(4):Doc44. DOI: 10.3205&#47;zma001121</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3205&#47;zma001121</RefLink>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Lienert GA</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1967</RefYear>
        <RefBookTitle>Testaufbau und Testanalyse</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Lienert GA. Testaufbau und Testanalyse. 2. Auflage. Weinheim: Beltz; 1967.</RefTotal>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>D&#246;ring N</RefAuthor>
        <RefAuthor>Bortz J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2016</RefYear>
        <RefBookTitle>Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>D&#246;ring N, Bortz J. Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften. 5. Auflage. Heideberg: Springer; 2016. DOI: 10.1007&#47;978-3-642-41089-5</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;978-3-642-41089-5</RefLink>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>B&#252;hner M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2011</RefYear>
        <RefBookTitle>Einf&#252;hrung in die Test- und Fragebogenkonstruktion</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>B&#252;hner M. Einf&#252;hrung in die Test- und Fragebogenkonstruktion. 3. akt. Auflage. M&#252;nchen: Pearson Studium; 2011.</RefTotal>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Rammstedt B</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2004</RefYear>
        <RefBookTitle>Zur Bestimmung der G&#252;te von Multi-Item-Skalen: Eine Einf&#252;hrung (ZUMA How-to-Reihe Nr. 12)</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Rammstedt B. Zur Bestimmung der G&#252;te von Multi-Item-Skalen: Eine Einf&#252;hrung (ZUMA How-to-Reihe Nr. 12). Mannheim: ZUMA; 2004.</RefTotal>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Nunnally JC</RefAuthor>
        <RefAuthor>Bernstein IH</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1994</RefYear>
        <RefBookTitle>Psychometric Theory</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Nunnally JC, Bernstein IH. Psychometric Theory. 3. Ed. New York: McGraw-Hill; 1994.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 1: Examples of competence domain, global item and in-depth item</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Beispiele f&#252;r Kompetenzfeld, Globalitem und vertiefendes Item</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 2: Design and structure of the FKM&#95;L</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Aufbau und Struktur des FKM&#95;L</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="en">3en</MediaID>
          <MediaID language="de">3de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 3: Results of the item analyses for the subscales formed with the in-depth items and for the overall scales for each domain of competence, and correlations between each subscale and the global items of a respective competence domain (N&#61;90)</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 3: Ergebnisse der Itemanalysen f&#252;r die mit den vertiefenden Items gebildeten Subskalen und f&#252;r die Gesamtskalen der Kompetenzfelder sowie Korrelationen der Subskalen mit den  Globalitems des jeweiligen Kompetenzfeldes (N&#61;90)</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>4</MediaNo>
          <MediaID language="en">4en</MediaID>
          <MediaID language="de">4de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 4: Intercorrelation of the Overall Scales of the FKM&#95;L </Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 4: Interkorrelation der Gesamtskalen des FKM&#95;L </Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>4</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="351" width="1004">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 1: Scale values for the overall scales of the six competence domains for three different participants in each of the courses MQ I and MQ II</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Skalenwerte f&#252;r die Gesamtskalen der sechs Kompetenzfelder f&#252;r jeweils drei verschiedene Teilnehmerinnen und Teilnehmer der</Mark1></Pgraph><Pgraph><Mark1>Kurse MQ I und MQ II</Mark1></Pgraph></Caption>
        </Figure>
        <Figure format="png" height="414" width="567">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 2: Scale values for the subscales of the competence domain Social and Communicative Competence for three participants of the MQ I courses</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 2: Skalenwerte f&#252;r die Subskalen des Kompetenzfeldes Soziale und Kommunikative Kompetenz f&#252;r drei Teilnehmerinnen und Teilnehmer der MQ I-Kurse</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>