데이터프레임을 이용할 때는 import pandas as pd 를 사용하여서 padas 모듈을 호출하여야 한다.
데이터프레임의 데이터에 접근하기
아래처럼 df 라는 이름의 데이터프레임 있을 때, 데이터에 접근 하는 방법은 다양하다.

- df에 있는 pants의 30 데이터에 접근하기
1. 먼저 컬럼으로 접근하는 방법이다.
데이터프레임이름[ '접근하고자 하는 컬럼명 ' ] 을 입력하면 컬럼명에 해당하는 데이터들이 나온다.
그 중 원하는 데이터를 뽑고자 한다면 슬라이싱 해주면 된다.
df[ 'pants' ][0] 을 해주면 30이 리턴된다.
2. .loc[ ] 로 접근하기
.loc[ ] 는 컬럼명과 인덱스 명을 입력하여서 접근하는 방법이다
대괄호 안에는 [ 컬럼명, 인덱스 명 ] 을 입력해준다.
df.loc [ 'store1', 'pants' ] 를 입력하면 30이 리턴된다.
3. iloc[ ] 로 접근하기
.iloc[ ] 는 인덱스와 컬럼 번호로 접근하는 방법이다.
대괄호 안에는 접근하고자 하는 인덱스 번호와 컬럼번호를 넣어주면 된다.
컴퓨터에서 숫자를 셀 때는 0부터 시작하기 때문에 store1 은 0, store2 는 1이 된다.
컬럼도 같은 방식이다. bikes는 0, pants는 1 ... 이다.
store1의 pants 값에 접근하기 위해서는 df.iloc[ 0 , 1 ]이라고 입력해주면 된다.

새로운 컬럼 만드는 방법
새로운 컬럼을 만드는 방법은 간단하다.
데이터프레임 이름 [ 새로운 컬럼 이름 ] = 넣고자 하는 데이터 값
형식으로 만들어주면 된다.

데이터를 삭제하는 방법
인덱스 삭제
아래와같은 데이터프레임 df 가 있을 때, 인덱스 store2를 삭제하고자 한다면, drop( )을 이용하면 된다.
괄호 안에는 ( ' 삭제하고자 하는 인덱스명' , axis= 0 ) 을 입력해준다.
여기서 axis = 0 은 행을 의미하고 axis = 1 은 열을 의미한다.

컬럼 삭제
컬럼을 삭제하는 방법도 동일하다. 데이터프레임명.drop( 삭제하고자 하는 컬럼명, axis= 1 ) 을 입력해준다.
glasses 컬럼을 삭제하기 위해서는 df.drop( 'glasses', axis= 1 ) 을 해준다.
만약 여러개의 컬럼을 삭제하고 싶다면 같은 방식으로 df.drop( 삭제하고자 하는 컬럼명을 리스트 형식으로 작성, axis = 1 ) 을 입력해주면 된다.

인덱스( index )명 변경하기
인덱스명을 변경하는 방법은 rename() 함수를 사용하면 된다.
데이터프레임명.rename( index = { 기존 인덱스명 : 바꾸고자하는 인덱스명 } ) 형식으로 작성해준다.
store3 를 last store로 변경하려면 df.rename( index = { 'store3' : 'last store'} ) 로 작성해준다.

여러가지 인덱스명을 바꾸는 방법도 동일하다.

컬럼( columns )명 바꾸기
컬럼명을 바꾸는 방법은 데이터프레임명.rename ( columns = { 기존 컬럼명 : 바꾸고자 하는 컬럼명 } ) 형식으로 작성해준다.
아래처럼 두가지 컬럼명을 바꾸려한다면 방법은 동일하다.
df.rename( columns= { 'bikes':'hat', 'suits':'shoes' } ) 로 작성해주면 된다.

컬럼의 값을 인덱스 값으로 만들기
컬럼의 값을 인덱스로 만드는 방법은 set_index( )를 사용하면 된다.
괄호안에는 인덱스로 만들고자 하는 컬럼명을 작성하면 된다.
여기서 inplace= 는 메모리 안에서의 라는 의미이다. inplace = True는 메모리 안의 값을 바꿔라 라는 의미이다

인덱스 값 초기화하기
인덱스 값 초기화 즉, 컴퓨터가 매기는 인덱스 값으로 만들기 위해서는 reset_index( ) 함수를 이용하면 된다.
df.reset_index( inplace= True ) 는 데이터프레임 df의 인덱스를 컴퓨터가 매기는 인덱스로 초기화 시켜라라는 의미이다.
inplace = True는 메모리 안의 값을 바꿔라 라는 의미이다

'Python' 카테고리의 다른 글
| [Pandas] - Dataframe 의 NaN 값 다루기 (0) | 2022.11.24 |
|---|---|
| [Pandas] - csv 파일 가져오기 (0) | 2022.11.24 |
| Numpy 활용하기 (0) | 2022.11.22 |
| 메모리 영역 - 메모리 , 스택 ( stack ) , 코드 영역 (0) | 2022.11.22 |
| 라이브러리 활용하기 - date/time (0) | 2022.11.22 |