pandas를 사용하여 엑셀(Excel) 파일의 데이터를 데이터프레임(DataFrame)으로 불러오는 방법
Series: Python Pandas
들어가며
pandas를 활용하여 엑셀 파일.xlsx을 읽어 DataFrame 객체로 변환할 수 있다. 예시에서 사용할 엑셀 파일(exam.xlsx)의 정보는 다음과 같다.
- 폴더명 :
C:\Users\CHOEWY\Desktop\ - 시트명 :
Exam
위의 엑셀 파일의 데이터는 아래와 같이 구성되어 있다.
| 번호 | 케이블 | 레이스웨이 |
|---|---|---|
| 1 | cable01 | raceway01 |
| 2 | cable01 | raceway02 |
| 3 | cable01 | raceway03 |
| 4 | cable01 | raceway04 |
| 5 | cable01 | raceway05 |
| 6 | cable02 | raceway03 |
| 7 | cable02 | raceway05 |
| 8 | cable02 | raceway07 |
| 9 | cable03 | raceway10 |
| 10 | cable03 | raceway11 |
| 11 | cable03 | raceway12 |
엑셀 파일 불러오기
엑셀 파일의 데이터를 불러오기 위한 전체 코드는 다음과 같다. 먼저 pandas를 사용하기 위하여 import하고, 호출하기 편하도록 pd로 축약한다. 파일의 경로를 excel이라는 변수에 저장하는데, 문자열 내 한 개의 \기호는 escape 문자 중 개행문자로 인식하므로, \ 기호를 \\ 또는 /로 바꾸어준다. 이어서 pandas의 read_excel함수를 사용하여 엑셀 파일을 DataFrame객체로 불러온다. 불러온 객체는 다양하게 접근 가능한데, 이는 다른 포스팅에서 정리하도록 하겠다.
import pandas as pd
excel = "C://Users/CHOEWY/Desktop/exam.xlsx"
df = pd.read_excel(excel)
print(df)위의 코드 실행하면 다음과 같이 DataFrame객체가 출력되는 것을 볼 수 있다.
'''
번호 케이블 레이스웨이
0 1 cable01 raceway01
1 2 cable01 raceway02
2 3 cable01 raceway03
3 4 cable01 raceway04
4 5 cable01 raceway05
5 6 cable02 raceway03
6 7 cable02 raceway05
7 8 cable02 raceway07
8 9 cable03 raceway10
9 10 cable03 raceway11
10 11 cable03 raceway12
'''마치며
다음에는 DataFrame을 엑셀 파일로 저장하는 방법에 대해서 정리해보겠다.