Inhoudsopgave:

Hoe ga je om met NA-waarden in R?
Hoe ga je om met NA-waarden in R?

Video: Hoe ga je om met NA-waarden in R?

Video: Hoe ga je om met NA-waarden in R?
Video: Handling NA in R | is.na, na.omit & na.rm Functions for Missing Values 2024, Mei
Anonim

Wanneer u een dataset importeert uit andere statistische toepassingen, wordt de ontbrekende waarden kan worden gecodeerd met een nummer, bijvoorbeeld 99. om te laten R weet dat dat een is missende waarde je moet het hercoderen. Een andere handige functie in R tot omgaan met ontbrekende waarden is nee . omit() waarmee onvolledige waarnemingen worden verwijderd.

Zo ja, hoe ga je om met NA in R?

NA opties in R

  1. weglaten en na. uitsluiten: retourneert het object met verwijderde waarnemingen als deze ontbrekende waarden bevatten; verschillen tussen het weglaten en uitsluiten van NA's zijn te zien in sommige voorspellings- en restfuncties.
  2. pass: retourneert het object ongewijzigd.
  3. fail: retourneert het object alleen als het geen ontbrekende waarden bevat.

Evenzo, hoe ga je om met ontbrekende categorische gegevens in R? Er zijn verschillende manieren om met ontbrekende waarden van categorische manieren om te gaan.

  1. Negeer waarnemingen van ontbrekende waarden als we te maken hebben met grote datasets en een kleiner aantal records heeft ontbrekende waarden.
  2. Negeer variabele als deze niet significant is.
  3. Model ontwikkelen om ontbrekende waarden te voorspellen.
  4. Behandel ontbrekende gegevens als gewoon een andere categorie.

Op dezelfde manier kan men zich afvragen, hoe stel je ontbrekende waarden in R in?

In R , ontbrekende waarden worden weergegeven door het symbool NA (niet beschikbaar). Onmogelijk waarden (bijvoorbeeld delen door nul) worden weergegeven door het symbool NaN (geen getal). In tegenstelling tot SAS, R gebruikt hetzelfde symbool voor karakter en numeriek gegevens . Voor meer oefening in het werken met ontbrekende gegevens , probeer deze cursus over schoonmaken gegevens in R.

Wat betekent Na Rm in R?

Bij gebruik van een dataframe-functie nee . rm in R verwijst naar de logische parameter die de functie vertelt of deze al dan niet moet worden verwijderd NA waarden uit de berekening. het letterlijk betekent NA verwijderen. Het is noch een functie, noch een operatie. Het is gewoon een parameter die door verschillende dataframefuncties wordt gebruikt.

Aanbevolen: