판다스는 DataFrame과 Series끼리 데이터 셀렉션 기능이 달라지는 부분이 있어 주의가 필요합니다. 넘파이의 경우 [] 연산자 내 단일 값 추출, 슬라이싱, 팬시 인덱싱, 불린 인덱싱을 통해 데이터를 추출합니다. 판다스는 iloc[], loc[] 연산자가 이와 같은 작업을 수행합니다. 먼저 판다스의 [] 연산자가 넘파이의 [] 연산자와 어떤 차이가 있는지를 알아보겠습니다. DataFrame의 []연산자 안에 들어갈 수 있는 것은 칼럼명 문자(또는 리스트 객체), 또는 인덱스로 변환 가능한 표현식입니다. 인덱스로 변환 가능한 표현식이라는 의미는 추후에 다룰텐데, 현재 수준에서는 DataFrame의 [] 연산자는 칼럼만 지정할 수 있는 '칼럼 지정 연산자'로 이해하는 게 혼돈을 막는 가장 좋은 방법입..
Pandas는 파이썬에서 데이터 처리를 위해 사용되는 인기있는 라이브러리 입니다. 판다스는 2차원 데이터 처리를 위한 많은 기능을 제공합니다. 판다스는 많은 부분이 넘파이 기반으로 작성됐습니다. 판다스의 핵심 개체는 DataFrame이며, 중요 객체로 Index와 Series가 있습니다. Index는 개별 데이터를 고유하게 식별하는 Key 값이며, Series와 DataFrame은 Index를 키값으로 가집니다. Series는 칼럼이 하나 뿐인 DataFrame이라고 생각하면 됩니다. 판다스는 다양한 포맷의 파일을 DataFrame으로 로딩할 수 있는 편리한 API를 제공합니다. 대표적으로 csv 파일이 있는데, 이는 칼럼을 콤마로 구분하는 파일 포맷입니다. 만약 다른 지정자로 필드를 구분한다면, rea..
Numpy는 다차원 행렬을 다루기 위한 파이썬 라이브러리입니다. 머신러닝 및 딥러닝 코드를 분석하거나 작성하려면 어느 정도는 반드시 잘 숙지하고 있어야 합니다. 본 책에선 Numpy의 수많은 기능 중 기초이자 핵심적인 부분만을 다룹니다. np.array() : 파이썬 리스트 같은 다양한 인자를 ndarray 타입으로 변환합니다. ndarray.shape, nidm 변수로 크기와 차원을 알 수 있습니다. shape의 반환값은 튜플입니다. ndarray 내의 모든 원소의 데이터 타입은 같습니다. 예를들어, int와 float를 같이 담을 수 없습니다. ndarray는 tolist() 메서드를 통해 파이썬 리스트로 캐스팅할 수 있습니다. 만약 서로 다른 데이터 타입이 들어있는 리스트를 ndarray 객체로 만..