Unik identifikationsvariabel i R og Stata

Aug 3, 2015

Hvis du står og mangler en identifikationsvariabel i dit datasæt/din data frame, altså en variabel hvor hver række har en unik værdi, er det heldigvis nemt at lave dette i R såvel som i Stata. I R overskriver du blot din data frame (i dette tilfælde kaldt din.dataframe) med en ny data frame, der har en variabel, som indeholder rækkenummeret for hver række. Derefter navngiver du variablen:

din.dataframe = cbind(1:NROW(din.dataframe), din.dataframe) colnames(din.dataframe)[1] = 'id'

I Stata er det endnu nemmere og kan gøres med følgende:

. g id = _n

I begge ovenstående tilfælde er variablen kaldt for id.

Erik Gahner Larsen
RSS
https://erikgahner.github.io/posts/feed.xml