os 모듈은 파이썬에서 운영 체제와 상호작용하기 위한 여러 기능을 제공한다. 데이터 사이언스에서는 파일 및 디렉토리 관리, 경로 처리, 환경 변수 제어 등에 사용된다.
# 예제 디렉토리 구조
project/
├── data/
│ ├── raw/
│ │ └── file.csv
│ │ └── example.csv
│ └── processed/
├── notebooks/
├── src/
├── models/
└── results/ # 실습 과정에서 생성 및 제거
└── test/ # 실습 과정에서 생성 및 제거
Operating System(운영체제, OS)는 사용자의 하드웨어, 시스템 리소스를 제어하고 프로그램에 대한 일반적인 서비스를 지원하는 시스템 소프트웨어이다.
import os
운영체제 이름 확인: os.name
os.name
ntposixDirectory(디렉토리 또는 폴더)는 파일 및 하위 디렉토리를 체계적으로 관리하기 위한 공간이다. 파일을 효율적으로 관리하기 위해 계층적 구조를 형성하며, 하나의 디렉토리는 여러 개의 파일과 하위 디렉토리를 가질 수 있다.
현재 작업 중인 디렉토리 확인: os.getcwd()
os.getcwd()
디렉토리 변경: os.chdir(path)
os.chdir(r"C:\\Users\\KU\\Desktop\\project")
디렉토리 목록: os.listdir(path=".")
# 현재 디렉토리 내 파일 목록
os.listdir()
os.listdir(".")
# 특정 디렉토리 내 파일 목록
os.listdir("data")
디렉토리 생성: os.mkdir(path) 또는 os.makedirs(name)
FileExistsError 발생, 이를 대비하기 위해 os.path.exists() 참고# 단일 생성
os.mkdir("results")
os.makedirs("results")
# 복합 생성
os.makedirs("results/test")
디렉토리 제거: os.rmdir(path) 또는 os.removedirs(name)
# 단일 제거
os.rmdir("results")
os.removedirs("results")
# 복합 제거
os.removedirs("results/test")
파일/디렉토리 이름 변경 또는 이동: os.renames(old, new)
# 파일/디렉토리 이름 변경
os.renames("data/raw/example.csv", "data/raw/train.csv")
# 파일/디렉토리 이동
os.renames(
"data/raw/train.csv",
"data/processed/train.csv"
)
Path(경로)는 파일이나 디렉토리의 위치를 나타내는 주소이다. 경로는 변수로 관리하는 것이 일반적이다.
PATH = "data/raw/file.csv"