De jury heeft de volgende inzendingen ontvangen.
Deelnemer: Steven Halbertsma
Titel scriptie: Airline scheduling with a delay focus
Doel van het onderzoek is het ontwerpen van een model dat, gegeven een luchtvaartdienstregeling, aanpassingen hieraan voorstelt, zodanig dat de verwachte reactionaire punctualiteitsprestatie verbeterd wordt. De verwachte punctualiteitsprestatie wordt hier gerepresenteerd door de som van alle vertraging-gerelateerde kosten. Reactionaire vertragingen zijn vertragingen van de 2e orde die het gevolg zijn van primaire vertragingen (bijv. airspace congestie, slecht weer) van eerdere vluchten.
Als parameters met een directe invloed op het mogelijke ontstaan van reactionaire vertragingen werden geïdentificieerd:
Het onderzoek voor de ontwikkeling van het 'schedule improvement model' richtte zich op drie onderdelen:
Ad 1:
Analyse van Amerikaanse en Europese vertragingsdata leverde een (niet-standaard) statistische verdelingsvorm op.
Hiermee kan per vlucht de verwachte vertraging bepaald worden.
Ad 2:
Beschikbare informatie over vertragingskosten is zeer beperkt. Met medewerking van de KLM was het
mogelijk om een ruwe schatting te maken van de gemiddelde toestel-gerelateerde operationele kosten per
minuut vertraging en de gemiddelde kosten per gemiste passagiers connectie.
Ad 3:
Het probleem is geformuleerd als Integer Linear Programming (ILP) model. Deze formulering kan door iedere
luchtvaartmaatschappij ter wereld gebruikt worden om optimale settings voor vertrek- en aankomsttijden voor
elke vlucht en optimale vliegtuigtype rotaties te berekenen.
Resultaten:
Het model is getest door middel van een case studie op de KLM dienstregeling van mei 2001.
Dit resulteerde in een veranderde setting voor vertrek- en aankomsttijden en veranderde vliegtuigtype
rotaties, wat leidt tot een verwachte punctualiteits prestatieverbetering van € 200,000 per week.
Deelnemer: Marloes Maathuis
Titel scriptie: Nonparametric maximum likelihood estimation for bivariate censored data
We study the behavior of the (nonparametric) maximum likelihood estimator (MLE) for bivariate censored data. The motivation for doing this was triggered by our interest in the problem of estimating the incubation time distribution of HIV/AIDS.
We study the computational and algorithmic aspects of the MLE for bivariate interval censored data. The computation of the MLE can be divided in two steps: a reduction step and an optimization step. In the reduction step we search for regions of possible mass support. This reduces the number of parameters. Then, in the optimization step, the actual optimization problem is solved. We introduce a reduction algorithm of time complexity O(n2), which is significantly faster than the existing algorithms of which we are aware.
Furthermore, we study theoretical properties of the MLE for models connected with the problem of estimating the incubation time distribution of HIV/AIDS. In particular, we give an interpretation of its definition in terms of graph theory and discuss different types of non-uniqueness that can arise.
We show that the naive MLE is inconsistent in two of the models that we consider. We introduce other estimators which can be viewed as modifications or extensions of the idea of maximum likelihood, and which, under certain conditions on the underlying distributions, will be consistent.
Our methods are illustrated by an analysis of data from the Amsterdam Cohort Study on injecting drug users and we construct several visualizations of the data. Finally, we point out a fundamental problem in the estimation of the incubation time distribution. Namely, without further assumptions that allow for some kind of extrapolation, we can only estimate the bivariate distribution function consistently in a fixed rectangular region of the plane. However, the incubation time distribution is derived from the bivariate distribution by integrating over diagonal strips that extend to infinity. Hence, without further assumptions the incubation time distribution cannot be estimated consistently.
The complete thesis is available at: http://www.stat.washington.edu/marloes.
Deelnemer: Robbert Nagtzaam
Titel scriptie: Het koopgedrag met betrekking tot 'slow movers', Modellering en analyse
'Slow movers' zijn producten met een lage aankoopfrequentie, waardoor het aantal waargenomen aankopen voor dit soort producten beperkt is. Dit zorgt ervoor dat men beperkingen ondervindt bij de modellering van het koopgedrag met betrekking tot 'slow movers'. In dit rapport wordt onderzocht of binaire, 'count' data en discreet/continue modellen voor paneldata voor GfK PanelServices Benelux een waardevolle uitbreiding zijn op het huidige assortiment van analyses waarmee het koopgedrag wordt gekwantificeerd.
De in het bovenstaande genoemde modellen verklaren drie aspecten van het koopgedrag (van consument i in kwartaal t in een bepaalde productcategorie):
Merk op dat bovenstaande variabelen zowel een tijdsdimensie als een dimensie voor individuen hebben. Dit geeft aan dat dit onderzoek betrekking heeft op paneldata modellen. De genoemde koopaspecten worden gemodelleerd en geanalyseerd voor de productcategorieën broeken, schoenen, jassen en bovenkleding, waarbij de categorie bovenkleding een verzameling is van broeken, jassen en andersoortige bovenkleding. De modellen vormen een potentiële oplossing voor het modelleringprobleem omdat ook de niet-kopers in een bepaald kwartaal worden gemodelleerd. Hierdoor wordt de hoeveelheid informatie die kan worden geanalyseerd, vergroot ten opzichte van analyses die alleen de kopers bevatten.
Het koopgedrag wordt in de hierboven genoemde modellen verklaard met behulp van socio-demografische dummy variabelen. Tevens wordt rekening gehouden met zogenaamde ongeobserveerde individuele heterogeniteit tussen de consumenten. Met andere woorden, verschillen in koopgedrag worden gemodelleerd die niet kunnen worden verklaard met behulp van verschillen in socio-demografische kenmerken. Voor ieder koopaspect worden statische en dynamische modellen tegen elkaar afgewogen. De schattingen zijn gebaseerd op de zogenaamde 'maximum likelihood' methode. De 'maximum likelihood' schatter is aantrekkelijk vanwege zijn asymptotische eigenschappen. Dit wil zeggen dat de schatter beter wordt naarmate de steekproef groter wordt.
De data voor dit onderzoek zijn afkomstig van het InterAct Panel van GfK PanelServices Benelux. Dit panel bestaat uit 5000 individuen uit de Nederlandse bevolking van 12 jaar en ouder. De panelleden registreren behalve aankopen met betrekking tot kleding en schoenen ook aankopen van o.a. speelgoed, beeld- en geluidsdragers, verzorgingsproducten en sieraden. Er is gebruikt gemaakt van een constante steekproef uit de jaren 1999 en 2000. De volgende redenen liggen hier aan ten grondslag:
Over de verschillende modellen en product categorieën heen, laten de schattingsresultaten het volgende beeld zien met betrekking tot de socio-demografische variabelen:
De verklarende en voorspellende kracht van de socio-demografische variabelen blijkt beperkt te zijn. Wel dient opgemerkt te worden dat het percentage verklaarde variantie in dit type modellen elders in de literatuur ook erg laag is. De schattingsresultaten tonen ook aan dat de ongeobserveerde individuele heterogeniteit groot is. Met andere woorden, twee personen met identieke socio-demografische kenmerken, kunnen volkomen verschillend aankoopgedrag hebben. Verder blijkt dat dynamische modellen de voorkeur verdienen boven statische modellen. Dit betekent dat het huidige koopgedrag een functie is van het koopgedrag in de vorige periode. Het koopgedrag van consumenten is niet constant in de loop van de tijd, maar een duidelijk opwaartse of neerwaartse trend is voor de jaren 1999 en 2000 niet zichtbaar.
De mogelijkheid om tegelijkertijd dynamiek en ongeobserveerde individuele heterogeniteit te modelleren, is een aantrekkelijke eigenschap van de paneldata modellen in dit onderzoek. Uit het bovenstaande blijkt ook dat deze modellen in staat zijn om bepaalde elementen van het koopgedrag te beschrijven. Tevens kunnen verschillen in koopkansen, verwachte bestedingen of verwachte aantallen aankopen worden bepaald tussen bepaalde kopers(groepen).
Voor de dynamische modellen die als beste uit het keuzeproces naar voren komen, is geen standaard software beschikbaar. Dit bemoeilijkt natuurlijk de implementatie van dit type modellen bij bedrijven. Een oplossing kan zijn om gebruik te maken van de 'second best' modellen in dit onderzoek. Die kunnen namelijk wel met 'één druk op de knop' worden geschat. Aangezien de schattingsresultaten niet in grote mate afwijken, is dit een serieuze overweging die gemaakt moet worden. Verder zou vervolgonderzoek uit kunnen wijzen of andere verklarende variabelen, bijvoorbeeld attitudes, het succes (in de zin van verklaringskracht) van deze modellen kunnen vergroten. In de tussentijd hebben de leveranciers van statische softwarepakketten de tijd om de softwaremogelijkheden op dit gebied te vergroten. Dit zou het onderzoek met betrekking tot dit type modellen een enorme impuls kunnen geven.
Deelnemer: Alex Siem
Titel scriptie: Fitting Kriging models for design optimization
Nowadays, engineers use highly sophisticated computer simulations to evaluate their product designs. However, these computer simulations can be very time-consuming. Therefore, the number of computer simulations that can be carried out may be limited.
In order to support engineers in finding optimal design parameter settings, the Centre for Quantitative Methods (CQM), developed the so-called 'compact model approach'. In this approach the time-consuming computer simulations, which can be seen as black-box functions, are approximated by so-called compact models. Frequently Kriging models are used as compact model.
Fitting Kriging models for datasets containing many simulations or many design parameters turns out to be very time-consuming. Currently CQM uses a zero-order method to solve a non-linear maximum likelihood optimization problem to fit Kriging models. Also, in some cases numerical problems are encountered. These arise for example when inverting ill-conditioned matrices.
The goal of this thesis is twofold. First, to clarify the ideas behind Kriging models for CQM. Second, to improve the currently used methodology at CQM for fitting Kriging models.
To this end, we discuss the idea's behind Kriging models. We discuss some assumptions that are made for the construction of Kriging models. Furthermore, we investigate Radial Basis Function (RBF) models as an alternative to Kriging models. A comparison is made between Kriging models and RBF models.
With use of the first derivatives of the log likelihood function we applied a first-order method to solve the non-linear maximum likelihood optimization problem. This turns out to be a considerable improvement in terms of speed and numerical stability.
Further, we present an approximation method to approximate the log likelihood function, which enables us to handle larger datasets with more simulations.
Finally, the need for global optimization of the maximum likelihood to fit Kriging models is investigated.