루시달 2024. 11. 4. 11:27

melt

 

melt는 데이터프레임을 길게(unpivot) 변환할 때 사용하는 판다스 메서드입니다. 열이 행으로 변환되어 데이터가 길고 얇은 형태로 바뀌며, 주로 데이터를 분석하기 쉽도록 표준화하거나, 피벗된 데이터를 원래 형태로 되돌리는 데 유용합니다.

주요 개념

  • melt는 여러 열에 나눠져 있는 데이터를 단일 열로 병합하여, 각 열의 이름이 새로운 열로, 열의 값이 또 다른 새로운 열로 변환됩니다.
  • Tidy data(정돈된 데이터)의 형식으로 데이터를 정리할 때 자주 사용됩니다.

기본 사용법

 

파라미터 설명

  • id_vars: 변환 시 고정할 열(즉, 그대로 유지되는 열)을 지정합니다.
  • value_vars: 행으로 변환할 열을 지정합니다. 생략하면 숫자형 열이 자동으로 변환됩니다.
  • var_name: 새로운 열의 이름을 지정합니다. 기존 열 이름들이 이 열에 들어갑니다.
  • value_name: 값이 들어갈 열의 이름을 지정합니다.

예제

예를 들어, 다음과 같은 넓은 형태의 데이터를 길게 변환해 보겠습니다.

설명

  • **Date**는 id_vars로 지정되었기 때문에 그대로 유지됩니다.
  • **A_Sales**와 **B_Sales**가 Category 열로 들어가고, 해당 값이 Sales 열로 들어갑니다.

사용 예시

  • 여러 열에 나눠진 값들을 하나의 열로 모아 분석 가능하도록 변환할 때.
  • 피벗 테이블처럼 열로 확장된 데이터를 원래 긴 형태로 되돌릴 때.
  • 시각화나 통계 분석을 위해 데이터가 정돈된 형태로 필요할 때.

요약

melt는 데이터프레임을 길게 변환하여 데이터를 정리하는 데 유용하며, 여러 열의 값을 하나의 열로 병합하여 분석과 시각화를 용이하게 합니다.

 

반응형