<aside> 💡 데이터 마트 구성에 중요한 요약변수와 파생변수 : 모형 개발할 때 문제를 가장 잘 해석할 수 있는 변수를 찾는 것은 모형 개발에서 가장 중요한 핵심단계 : 데이터 마트 구성 시 가장 중요한 데이터는 데이터 웨어하우스로부터 받아오는 데이터 ⇒ 요약변수 | 데이터를 특정 기준에 따라 사칙연산을 통해 만들어 낸 변수 ⇒ 파생변수 | 사용자의 노하우를 기반으로 새롭게 만들어 낸 변수

</aside>

<aside> 💡 R프로그램에서의 reshape 패키지 : 데이터 마트를 생성할 수 있도록 데이터를 녹이고(melt) 다시 형상화(cast)할 수 있는 R패키지, 분석용 마트 설계에서 잘 활용

</aside>

<aside> 💡 R프로그램에서 SQL의 활용 : sqldf라는 패키지를 통해 활용 가능, sqldf 함수를 사용하면 모든 SQL문장을 거의 똑같은 형식으로 사용할 수 있게 됨

</aside>

<aside> 💡 data.table 패키지 : dataframe과 같은 구조를 가지고 있으나 key를 활용해 훨씬 빠른 연산이 가능하게 만든 패키지

</aside>


✳️ 데이터 변경 및 요약

1) R reshape를 이용한 데이터마트 개발