데이터사이언티스트 Data Scientist
melt 메소드
루시달
2024. 11. 4. 11:27
melt
melt는 데이터프레임을 길게(unpivot) 변환할 때 사용하는 판다스 메서드입니다. 열이 행으로 변환되어 데이터가 길고 얇은 형태로 바뀌며, 주로 데이터를 분석하기 쉽도록 표준화하거나, 피벗된 데이터를 원래 형태로 되돌리는 데 유용합니다.
주요 개념
- melt는 여러 열에 나눠져 있는 데이터를 단일 열로 병합하여, 각 열의 이름이 새로운 열로, 열의 값이 또 다른 새로운 열로 변환됩니다.
- Tidy data(정돈된 데이터)의 형식으로 데이터를 정리할 때 자주 사용됩니다.
기본 사용법
파라미터 설명
- id_vars: 변환 시 고정할 열(즉, 그대로 유지되는 열)을 지정합니다.
- value_vars: 행으로 변환할 열을 지정합니다. 생략하면 숫자형 열이 자동으로 변환됩니다.
- var_name: 새로운 열의 이름을 지정합니다. 기존 열 이름들이 이 열에 들어갑니다.
- value_name: 값이 들어갈 열의 이름을 지정합니다.
예제
예를 들어, 다음과 같은 넓은 형태의 데이터를 길게 변환해 보겠습니다.
설명
- **Date**는 id_vars로 지정되었기 때문에 그대로 유지됩니다.
- **A_Sales**와 **B_Sales**가 Category 열로 들어가고, 해당 값이 Sales 열로 들어갑니다.
사용 예시
- 여러 열에 나눠진 값들을 하나의 열로 모아 분석 가능하도록 변환할 때.
- 피벗 테이블처럼 열로 확장된 데이터를 원래 긴 형태로 되돌릴 때.
- 시각화나 통계 분석을 위해 데이터가 정돈된 형태로 필요할 때.
요약
melt는 데이터프레임을 길게 변환하여 데이터를 정리하는 데 유용하며, 여러 열의 값을 하나의 열로 병합하여 분석과 시각화를 용이하게 합니다.
반응형