Python

[pandas] 피봇 테이블 다루기 pivot table

yugyeong 2022. 11. 30. 17:28

 

pivot table

 

피봇팅 한다. 즉 컬럼의 값을 인덱스로 만들되,  인덱스를 중복제거하여 유니크 하게 만드는 방법이다.

 

 

아래와같은 데이터프레임이 있을 때, 피봇테이블을 알아보자.

 

 

피봇 테이블 만들기

 

pd.pivot_table() 을 이용하여서 동일한 컬럼명의 수치 데이터들을 합치는 결과를 리턴할 수 있다.

파라미터 값으로는 데이터프레임명과, index 에는 유니크하게 만들고자 하는 컬럼명을 넣어준다.

결과값은 수치데이터들의 평균값이 리턴된다.

 

 

만약, 수치 데이터들의 더한 값을 리턴받고 싶다면 파라미터 aggfunc 에 구하고자 하는 데이터의 계산 값을 넘파이 형식으로 적어준다. 더한 값을 리턴 받고자 하였으니, np.sum 을 넣어주면 된다.

 

 

 

두개의 컬럼을 유니크하게 만들기

만약 두개의 컬럼을 유니크하게 만들고자 한다면, index 파라미터에 컬럼을 리스트 형식으로 넣어주면 된다.

 

 

 

 

 

특정 컬럼의 수치 데이터들끼리 연산을 원하지 않을 경우

 

만약 특정 컬럼들끼리의 연산을 원하지 않을 경우에는 values 파라미터를 이용하여 연산을 원하는 컬럼들만 리스트 형식으로 넣어준다.

그리고 수치 데이터들의 합과 평균값 두가지를 나타내고 싶다면 aggfunc 파라미터에 넘파이형식으로 두가지의 계산을 넣어주면 된다.