Nice programing

날짜에서 연도 추출

nicepro 2020. 12. 13. 11:06
반응형

날짜에서 연도 추출


특히이 변수에 특수 문자가있는 경우 변수에서 첫 번째 요소를 제거하려면 어떻게해야합니까? 예를 들어, 다음 열이 있습니다.

Date
01/01/2009
01/01/2010
01/01/2011
01/01/2012

다음과 같은 새 열이 필요합니다.

Date
2009
2010
2011
2012

모든 날짜의 너비가 같으면 날짜를 벡터에 넣고 하위 문자열을 사용할 수 있습니다.

Date
a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
substring(a,7,10) #This takes string and only keeps the characters beginning in position 7 to position 10

산출

[1] "2009" "2010" "2011"

주석에서 논의했듯이 항목을 Date형식 으로 변환 하고 연도를 추출하면 다음과 같이 수행 할 수 있습니다 .

format(as.Date(df1$Date, format="%d/%m/%Y"),"%Y")

library(lubridate)
a=mdy(b)
year(a)

https://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html http://vita.had.co.nz/papers/lubridate.pdf


변수를 Date다음으로 변환 할 때 :

date <-  as.Date('10/30/2018','%m/%d/%Y')

그런 다음 원하는 요소를 잘라 내고 연도와 같은 새 변수를 만들 수 있습니다.

year <- as.numeric(format(date,'%Y'))

또는 월 :

month <- as.numeric(format(date,'%m'))

이것은 특정 답변보다 더 많은 조언이지만 내 제안은 날짜를 문자열로 유지하는 대신 날짜를 날짜 변수로 즉시 변환하는 것입니다. 이렇게하면 매우 번거로운 해결 방법을 사용하지 않고 날짜 (및 시간) 기능을 사용할 수 있습니다.

지적했듯이 윤활유 패키지에는 좋은 추출 기능이 있습니다.

일부 프로젝트의 경우 처음부터 날짜를 연결하는 것이 도움이된다는 사실을 발견했습니다. 시작할 연도, 월, 일 (월) 및 일 (주) 변수를 만듭니다. 추출 코드가 요약 / 표 / 그래프 코드와 분리되어 있고 변경해야 할 경우 여러 지점에서 이러한 변경 사항을 롤아웃 할 필요가 없기 때문에 요약, 표 및 그래프를 단순화 할 수 있습니다.


datepackage를 사용한다면 이것은 상당히 쉽게 할 수 있습니다.

library(date)
Date <- c("01/01/2009", "01/01/2010", "01/01/2011", "01/01/2012")
Date <- as.date(Date)
Date
# [1] 1Jan2009 1Jan2010 1Jan2011 1Jan2012
date.mdy(Date)$year
# [1] 2009 2010 2011 2012

## be aware that these are now integers and thus different methods may be invoked:
str(date.mdy(Date)$year)
# int [1:4] 2009 2010 2011 2012
summary(Date)
#     First      Last   
# "1Jan2009" "1Jan2012" 
summary(date.mdy(Date)$year)
#    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#    2009    2010    2010    2010    2011    2012 

참고URL : https://stackoverflow.com/questions/36568070/extract-year-from-date

반응형