NumPy는 선형대수학을 수행하기 위한 기능을 제공하는 가장 대표적인 라이브러리이다.
Broadcasting(-)
NumPy는 다차원 배열과 행렬 연산을 빠르고 효율적으로 처리하기 위한 데이터 사이언스의 핵심 라이브러리이다.
import numpy as np
ndarray(N-dimensional array)는 NumPy 배열의 데이터 타입이다.
numpy.ndarrayarr = np.array([1, 2, 3, 4, 5, 6, 7, 8])
type(arr) # numpy.ndarray
print(arr) # [1 2 3 4 5 6 7 8]
arr # array([1, 2, 3, 4, 5, 6, 7, 8])
각 차원의 크기 확인: ndarray.shape
arr.shape # (8,)
차원의 수 확인: ndarray.ndim
arr.ndim # 1
전체 원소 개수: ndarray.size
arr.size # 8
배열 형태 변경: ndarray.reshape
arr.reshape(2, 4)
# array([[1, 2, 3, 4],
# [5, 6, 7, 8]])
자동 추론: -1
arr.reshape(2, -1)
# array([[1, 2, 3, 4],
# [5, 6, 7, 8]])
타입 확인: ndarray.dtype
arr.dtype
# dtype('int64')
타입 변경: ndarray.astype(dtype)
arr.astype(dtype=np.float32)
# array([1., 2., 3., 4., 5., 6., 7., 8.], dtype=float32)
NumPy에서 제공하는 상수를 설명한다. np.nan은 원시 데이터에서 자주 볼 수 있는 값이다.
$\pi = 3.141592$: np.pi
np.pi
$e = 2.718281$: np.e
np.e