Unik identifikationsvariabel i R og Stata
Aug 3, 2015
Hvis du står og mangler en identifikationsvariabel i dit datasæt/din data frame, altså en variabel hvor hver række har en unik værdi, er det heldigvis nemt at lave dette i R såvel som i Stata. I R overskriver du blot din data frame (i dette tilfælde kaldt din.dataframe) med en ny data frame, der har en variabel, som indeholder rækkenummeret for hver række. Derefter navngiver du variablen:
din.dataframe = cbind(1:NROW(din.dataframe), din.dataframe) colnames(din.dataframe)[1] = 'id'
I Stata er det endnu nemmere og kan gøres med følgende:
. g id = _n
I begge ovenstående tilfælde er variablen kaldt for id.