Python

[Pandas] - 데이터 정렬하기 , sort_values

yugyeong 2022. 11. 25. 12:28

 

 

데이터프레임에서 데이터를 정렬할 때는 sort_values 를 이용한다.

 

 

오름차순

 

 

오름차순 정렬은 sort_value 함수에 ascending= True 라고 해주면 된다. 여기서 ascending= True 는 디폴트 값이기 때문에 생략이 가능하다.

 

아래 예시를 보자.

아래 데이터 프레임에서 Years of Experience 를 오름차순으로 정렬하고자 한다면, 데이터프레임명.sort_value( '컬럼명', ascending= True ) 이라고 적어주면 된다

==> df.sort_values('Years of Experience', ascending= True)

 

 

 

 

내림차순

 

내림차순 정렬은 ascending 값만 False 로 변경해주면 된다.

작성하면 df.sort_values('Years of Experience', ascending= False) 와 같은 형태가 된다.

 

 

 

 

두개의 컬럼 정렬하기

 

두가지 컬럼을 정렬하는 방법은 sort_value 함수 괄호 안에 컬럼명을 리스트 형식으로 작성해주면 된다.

아래의 데이터프레임 컬럼에서 'Employee Name' 의 동일 값이 있으면, 동일 값에서 Years of Experience 를 오름차순으로 정렬해준다.

 

 

 

두개의 컬럼에서 한컬럼은 오름차순, 다른컬럼은 내림차순으로 정렬하기

 

두개의 컬럼을 정렬하고자 할 때, 첫번째 컬럼은 오름차순, 다른 컬럼은 내림차순으로 정렬하고 싶다면 위의 방법을 약간만 응용하면 된다.

df.sort_values(['Employee Name','Years of Experience'], ascending=[ True, False ]) 를 보면 정렬하고자하는 컬럼 값도 리스트 형식, ascending도 리스트 형식으로 True, False 값이 들어있다.

 

이것의 의미는 'Employee Name' 는 오름차순( ascending= True ) , 'Years of Experience'는 ( ascending= False ) 로 정렬하라는 의미이다.

 

 

 

인덱스 정렬하기

 

인덱스를 정렬하는 방법은 sort_index 함수를 사용하면 된다.