Inhoudsopgave:

Wat is een multivariate uitbijter?
Wat is een multivariate uitbijter?

Video: Wat is een multivariate uitbijter?

Video: Wat is een multivariate uitbijter?
Video: Identifying Multivariate Outliers with Mahalanobis Distance in SPSS 2024, November
Anonim

EEN multivariate uitbijter is een combinatie van ongebruikelijke scores op ten minste twee variabelen. Beide soorten uitbijters kan de uitkomst van statistische analyses beïnvloeden. uitschieters bestaan om vier redenen. Onjuiste gegevensinvoer kan ertoe leiden dat gegevens extreme gevallen bevatten.

Evenzo wordt gevraagd: hoe herken je bivariate uitbijters?

Een manier om te controleren als deze zo zijn" bivariate uitschieters " is om de residuen van de gevallen in de analyse te onderzoeken. Om dit te doen, verkrijgen we de bivariaat regressieformule, pas deze toe op elk geval om de y' te verkrijgen, en bereken dan het residu als y-y'. Eigenlijk zal SPSS dit voor ons doen binnen een regressierun.

Je kunt je ook afvragen, wat is het verschil tussen multivariate en univariate? Univariate en multivariate vertegenwoordigen twee benaderingen van statistische analyse. Univariate omvat de analyse van een enkele variabele, terwijl multivariate analyse onderzoekt twee of meer variabelen. Meest multivariate analyse omvat een afhankelijke variabele en meerdere onafhankelijke variabelen.

Met dit in overweging, wat zijn de verschillende soorten uitbijters?

De drie verschillende soorten uitbijters

  • Type 1: Globale uitschieters (ook wel “Puntafwijkingen” genoemd):
  • Globale anomalie:
  • Type 2: Contextuele (voorwaardelijke) uitschieters:
  • Contextuele anomalie: Waarden vallen niet buiten het normale globale bereik, maar zijn abnormaal in vergelijking met het seizoenspatroon.
  • Type 3: Collectieve uitschieters:

Hoe herken je multivariate uitbijters?

Multivariate uitschieters kan worden geïdentificeerd met behulp van Mahalanobis-afstand, de afstand van een gegevenspunt tot het berekende zwaartepunt van de andere gevallen waarin het zwaartepunt wordt berekend als het snijpunt van het gemiddelde van de variabelen die worden beoordeeld.

Aanbevolen: