Narrow your search

Library

KU Leuven (3)


Resource type

dissertation (2)

book (1)


Language

English (2)

Dutch (1)


Year
From To Submit

2008 (1)

2007 (1)

2004 (1)

Listing 1 - 3 of 3
Sort by

Dissertation
Individuele verschillen in categorieleren

Loading...
Export citation

Choose an application

Bookmark

Abstract

Keywords


Book
Modeling residual dependencies in item response models with copulas.
Authors: --- ---
Year: 2007 Publisher: Leuven K.U.Leuven. Faculteit Psychologie en pedagogische wetenschappen

Loading...
Export citation

Choose an application

Bookmark

Abstract

Keywords


Dissertation
Modeling Residual Dependencies in Latent Variable Models with Copulas.

Loading...
Export citation

Choose an application

Bookmark

Abstract

Latente variabele modellen zijn populair in vele domeinen waarin constructen voorkomen die indirect gemeten worden door middel van een set manifeste indicatoren. Voorbeelden van zulke modellen zijn factor analyse, item-responsmodellen, en structurele vergelijkingsmodellen. Een basis assumptie van bijna alle latente variabele modellen is conditionele onafhankelijkheid, zodat de latente variabelen verondersteld worden de volledige afhankelijkheid tussen de manifeste indicatoren volledig te verklaren. Het is echter onwaarschijnlijk dat de meeste datasets perfect voldoen aan deze stricte vereiste, omdat het gebruikelijk is dat een subset van indicatoren een gemeenschappelijk kenmerk delen buiten de doelconstructs. Het gevolg hiervan is dat er associatie overblijft tussen deze indicatoren zelfs na controle voor de latente variabelen. Het negeren van deze residuele afhankelijkheden kan leiden tot vertekende inferenties door modelmisspecificatie. Oplossingen voor dit probleem zijn vrij voor de hand liggend en rechttoe rechtaan te implementeren in normale lineaire modellen, maar dit is zeker niet het geval voor categorische datamodellen. Dit proefschrift introduceert een nieuwe modelbenadering om deze residuele afhankelijkheden in rekening te brengen. Door copulafuncties binnen bestaande latente variabele modellen in te passen, wordt een model ontwikkeld dat beter de afhankelijkheidstructuur vat, maar toch een eenvoudige structuur en helderheid behoudt. Copulae ontstonden binnen de wiskunde bij het bestuderen van de relatie tussen multidimensionele distributies en hun lager-dimensionele marges, maar zijn binnen latente variabele modellen onbekend terrein. De focus ligt dan ook op het onderzoeken van de mogelijkheden van het gebruik van deze copulae binnen latente variabele modellen. Een groot voordeel van deze copulabenadering ligt in de bovenwaardse compabiliteit met de reproduceerbaarheid van de marginale modelstructuur. In hoofdstuk 1 worden de fundamenten van de copulabenadering gelegd binnen het bekende unidimensionele Rasch model voor binaire manifeste variabelen. In vergelijking met alternatieve benaderingen is het sleutelelement de dubbele flexibiliteit van de copula (marges voor de individuele variabelen en afhankelheidstructuur voor hun gezamenlijk gedrag). In hoofdstuk 2, wordt een model ontwikkeld dat covariate informatie over de steekproefeenheden expliciet in het marginale model opneemt of impliciet via een finite-mixturedistributie voor de latente variabele. Binnen dit model van een screeningsinstrument voor geboortedefecten worden residuele afhankelijk-heden tussen manifeste variabelen aangepakt via copulae. In hoofdstuk 3, wordt de copulabenadering gegeneraliseerd naar het geval van ordinale manifeste variabelen binnen een structureel vergelijkingsmodel voor een gecontextualiseerde persoonlijkheidsvragenlijst. De combinatie van een meetmodel voor manifeste variabelen en een multidimensioneel structureel model voor de onderliggende set van latente variabelen, wordt uitgebreid met copulae voor de residuele afhankelijkheden. In hoofdstuk 4, wordt het thema modelselectie aangesneden voor de met copulae uitgebreide latente variabele modellen. Verschillende selectiecriteria worden voorgesteld en hun performantie onderzocht in een simulatiestudie. Het blijkt dat ondanks dat eenvoudige model selectie criteria op het eerste gezicht niet geschikt lijken voor deze toepassing, ze toch vaak hun meer ingewikkelde soortgenoten overtreffen. In hoofdstuk 5, wordt een matlab toolbox voorgesteld voor het calibreren van item-responsmodellen voor binaire data, inclusief onze eigen copula-uitbreiding. Latent variable models are popular in many domains in which there are constructs of interests that are measured using a set of manifest indicators. Examples of such models are factor analysis, item response models, and structural equation models. A basic assumption of almost all latent variable models is conditional independence such that the latent variables are considered to completely explain the association between the manifest indicators. However, this assumption is such a strict requirement that it is unlikely to be met completely for most datasets, because it is quite common that a subset of indicators share some additional feature besides the constructs of interest. As a result there remains association between these indicators even after accounting for the latent variables. Ignoring these residual dependencies may lead to biased inferences, due to model misspecification. Solutions for this problem are rather obvious and straightforward to implement in normal linear models, but this is not the case for categorical data models. This dissertation introduces a novel modeling approach to account for residual dependencies. By including copula functions within the current latent variable model tradition, a model is developed that more properly accounts for the dependence, while still retaining simple structure and clarity. Copula functions originated in mathematics, from the investigation of relations between multidimensional distributions and their lower-dimensional margins, but remained a unexplored tool within the latent variable modeling framework. Therefore the focus is on investigating the possibilities of the use of copulas within latent variable models. A major advantage of the copula approach has to do with its upward compatibility and specifically the reproducibility of the marginal model structure. In Chapter 1, the foundations of the copula approach are explained and applied to the well-known unidimensional Rasch model for binary manifest variables. A comparison between competing approaches is made and it is shown that the key element here is the double flexibility of the copula approach (i.e., margins for the individual variables and dependence structure for their joint behaviour). In Chapter 2, a latent variable model is developed to accommodate the specific demands inherent to a birth defects screening instrument. A unidimensional two-parameter logistic model is used to model the presence/absence of specific anomalies. Covariates for the sample units, in this case newborns, are included explicitly in the marginal model, and the latent trait distribution is made flexible by adopting a finite mixture approach. Residual dependencies are again accounted for by copulas. Another generalization is proposed in Chapter 3, where the copula approach is extended towards the case of ordinal manifest variables hereby allowing for correlated errors in structural equation models for categorical data. Besides the presence of polytomous response categories, another point of difference with the previous chapters is that the model, applied to a contextualized personality inventory, is now multidimensional. In Chapter 4, the issue of model selection is investigated. There is a wide variety of possible copula functions and it is not always clear which one to choose. Several model selection criteria are proposed and their performance investigated in a simulation study. It appears that simple model selection criteria, although not suited at first sight, often outperform other more complicated ones. Chapter 5 contains the description of a Matlab toolbox for fitting explanatory item response theory models for binary data. There is a lack of this type of software for Matlab, and the toolbox also includes the novel copula approach for residual dependencies. Iemands lichaamsgewicht kan vrij eenvoudig en rechtuit bepaald worden met behulp van een weegschaal. Het bepalen van iemands spellingvaardigheid is al iets minder voor de hand liggend. Er speelt niet alleen mee hoeveel woorden iemand correct kan spellen, maar ook hoe moeilijk deze woorden zijn om te spellen. In principe volstaat een simpele optelsom van het aantal fouten dus niet om een juist beeld te geven van iemands spellingvaardigheid. De situatie wordt nog gecompliceerder als je wil meten hoe optimistisch iemand is of hoe het gesteld is met diens emotioneel welzijn. De moeilijkheid ligt in het feit dat je niet kan `raken' wat je wil meten. We spreken hier over een latente eigenschap die in tegenstelling tot iemands gewicht niet fysiek te isoleren valt, maar onder de onmiddellijk tastbare oppervlakte ligt. De constructie van een test om een latente eigenschap te meten is zowel kunst als wetenschap. Slechts één woord dicteren en nagaan of de persoon dit woord correct spelt, is bijvoorbeeld niet voldoende om een precieze en betrouwbare schatting te geven van iemands spellingvaardigheid, daarvoor heb je een heel aantal dergelijke woorden nodig. Bovendien moeten deze om te kunnen spreken van een valide meting het hele domein omvatten waar je een oordeel over wil vellen. Input van iemand die weet waarover hij spreekt is dus noodzakelijk voor het ontwerpen van items voor de test. Anderzijds, heb je ook een meer objectieve kijk op de zaak nodig die je test kan evalueren los van de inhoud en een manier om de antwoorden op deze items te vertalen naar bruikbare getallen op een meetschaal. Dit heeft geleid tot het ontwikkelen van wiskundige kansmodellen om het meetproces te onderbouwen. Een basis modelprincipe stelt dat elk item unieke informatie toevoegt over de te meten latente eigenschap. Iemands antwoordpatroon op een test is dus vooral toe te schrijven aan hoe sterk deze latente eigenschap aanwezig is in deze persoon. Mensen met een grotere spellingvaardigheid zullen bijvoorbeeld zowel meer als moeilijkere woorden correct spellen. Het is echter niet ongewoon dat bepaalde items een gemeenschappelijke factor, bv. een subthema, delen. Het antwoordpatroon op zulke items is niet enkel een functie van de te testen latente eigenschap, maar is ook toe te schrijven aan hun kunstmatige gemene deler. Als je bijvoorbeeld erg vertrouwd bent met het subthema zal je meer kans hebben alle items in de subset correct te spellen. Deze items voegen dus overlappende, i.p.v. unieke, informatie toe. Dit verstoort je meetproces aangezien het specifieke subthema niet datgene is waarin je eigenlijk geïnteresseerd bent, en je vertekende resultaten krijgt die je niet kan doortrekken naar een algemene conclusie over de latente eigenschap. Dit proefschrift behandelt de ontwikkeling van meetmodellen om een dergelijke situatie in rekening te brengen. Determining someone's body weight can be done in a straightforward fashion by means of a weight scale. How to measure spelling proficiency is already less obvious. The amount of words someone can correctly spell has to be taken into account, but also how difficult these words are. A simple sum score of the number of faults would not give a complete picture of someone's spelling proficiency. Being able to correctly spell hundreds of three-letter words does not make one a spelling master, neither does being able to correctly spell the words in the title of this dissertation. Things get even more complicated, when trying to measure how optimistic a person is or when determining someone's emotional wellbeing. The difficulty lies here in the fact that you can not "touch" that what you want to measure. It are latent characteristics, that in contrast to body weight, can not be isolated physically, but are underlying the direct observable surface. Constructing a test to measure such latent characteristic is both art and science. It is not sufficient to just ask a person to spell one word, to make a reliable and precise estimate of spelling proficiency a whole set of words is needed. Moreover, to obtain a valid measurement this set needs to contain words from the full domain about which you want to make a judgement. Hence when developing items for such test, the input of a contents expert is a necessity. However, regardless of the specific contents, an objective perspective is also needed to evaluate the test and to translate the item responses to usefull numbers on a measurement scale. This lead to the development of mathematical probability models to support this measurement process. A basic model principle states that each item adds unique information about the latent characteristic of focus. Someone's item response pattern on a test is ascribed to how strong the latent characteristic is present in this person. For instance, people with a stronger spelling proficiency will spell both more as more difficult words correct. However, it is not unusual that certain items share a common factor, for instance a sub theme. The response pattern on such items is not only a function of the latent characteristic of focus, but can also be partly ascribed to their artificial common denominator. If the specific subtheme is very familiar to you, you will have more chance to correctly spell the words in that subset. These items will then supply overlapping instead of unique information. This will distort your measurement process, because the subtheme is in fact not your primary focus, making your result not fully generalizable towards the latent characteristic you are interested in. In this dissertation new measurement models that are able to account for such situations, are proposed.

Keywords

Listing 1 - 3 of 3
Sort by