데이터프레임을 연결할 때는 concat 과 merge 함수를 이용한다.
concat( )
데이터를 위아래로 연결할 때에는 concat() 을 이용한다.
아래에 데이터프레임 df1과 df2가 있다.

pd.concat() 을 이용할 때 괄호 안에는 연결할 데이터프레임을 리스트로 작성하면 된다.
df1 아래에 df2 를 연결하려면 pd.concat( [ df1, df2 ] ) 로 작성을 하면된다.

여러개의 데이터프레임을 연결할 수도 있다.
아래의 예시처럼 데이터프레임 3개를 연결하고자 한다면, 리스트 안에 세개의 데이터프레임을 넣어주면 된다.

merge( )
merge() 는 데이터프레임을 옆으로 연결하고 싶을 때 사용하는 함수이다.
두 데이터프레임의 공통 컬럼 (연결고리)이 있으면, 이 컬럼을 기준으로 해서, 하나로 합칠 수 있다.
단 merge 함수는 두 개의 데이터프레임만 합칠 수 있다.
아래에 데이터프레임 예시 df_all 과 df_salary 가 있다.

두 데이터프레임에 공통으로 있는 데이터만 합쳐줄 때에는
pd.merge() 에서 괄호 안에 데이터프레임 두개를 적어준 후 파라미터 on= 에 기준 컬럼을 적어준다.
아래는 기준 컬럼의 공통 값들만 연결하여서 보여준 데이터이다.

만약, 공통된 데이터만 나타나지 않고 기준 컬럼의 모든 데이터가 나타나게 하고 싶다면, 파라미터 how= 를 이용한다.
how= 'left' 를 쓰면 왼쪽 데이터프레임을 기준으로 데이터를 연결하라는 의미이다.

만약 오른쪽에 적은 데이터프레임을 기준으로 데이터를 연결하려 한다면, how= 'right'로 적어주면 된다.

'Python' 카테고리의 다른 글
| [Matplotlib] Bar Chart 만들기 (0) | 2022.11.28 |
|---|---|
| [pandas] - str.contains (0) | 2022.11.25 |
| [Pandas] - 유일한 값 찾기 unique(), nunique(), value_counts() (0) | 2022.11.25 |
| [Pandas] - 데이터 정렬하기 , sort_values (0) | 2022.11.25 |
| [Pandas] - apply 함수, str 라이브러리 (0) | 2022.11.25 |