pivot table
피봇팅 한다. 즉 컬럼의 값을 인덱스로 만들되, 인덱스를 중복제거하여 유니크 하게 만드는 방법이다.
아래와같은 데이터프레임이 있을 때, 피봇테이블을 알아보자.

피봇 테이블 만들기
pd.pivot_table() 을 이용하여서 동일한 컬럼명의 수치 데이터들을 합치는 결과를 리턴할 수 있다.
파라미터 값으로는 데이터프레임명과, index 에는 유니크하게 만들고자 하는 컬럼명을 넣어준다.
결과값은 수치데이터들의 평균값이 리턴된다.

만약, 수치 데이터들의 더한 값을 리턴받고 싶다면 파라미터 aggfunc 에 구하고자 하는 데이터의 계산 값을 넘파이 형식으로 적어준다. 더한 값을 리턴 받고자 하였으니, np.sum 을 넣어주면 된다.

두개의 컬럼을 유니크하게 만들기
만약 두개의 컬럼을 유니크하게 만들고자 한다면, index 파라미터에 컬럼을 리스트 형식으로 넣어주면 된다.

특정 컬럼의 수치 데이터들끼리 연산을 원하지 않을 경우
만약 특정 컬럼들끼리의 연산을 원하지 않을 경우에는 values 파라미터를 이용하여 연산을 원하는 컬럼들만 리스트 형식으로 넣어준다.
그리고 수치 데이터들의 합과 평균값 두가지를 나타내고 싶다면 aggfunc 파라미터에 넘파이형식으로 두가지의 계산을 넣어주면 된다.

'Python' 카테고리의 다른 글
| 파이썬으로 압축파일 푸는 방법 (zipfile) (0) | 2022.12.30 |
|---|---|
| Python 데이터프레임을 sb.heatmap 으로 나타내기 (0) | 2022.11.30 |
| [pandas] 판다스에서 datetime 다루기 - Pandas Time Series (0) | 2022.11.30 |
| [pandas] 판다스에서 문자열 슬라이싱 & 시리즈를 데이터프레임 or 리스트로 만들기 (0) | 2022.11.30 |
| [pandas] dataframe.plot 함수 (0) | 2022.11.29 |