모도리는 공부중

20.11.12. 오후 - 파이썬라이브러리(PL) numpy 본문

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝)

20.11.12. 오후 - 파이썬라이브러리(PL) numpy

공부하는 모도리 2020. 11. 12. 17:45
728x90
반응형

ppt교재 Numpy

 

모듈(라이브러리)

 - 약간 계산기라고 부르고 싶다고..

  • 확장자가 .py인 파일
  • 변수나 함수 또는 클래스를 모아놓은 파일
  • 파이썬 프로그램에서 불러와 사용할 수 있게끔 만들어진 파이썬 파일이라고도 한다.

import 모듈이름

모든 연산자 사용 가능

from 모듈이름 import 함수(or클래스)

특정 연산자만 사용하기 원할때

 

 

책을 보고 공부가 필요할 것 같다!!

파이썬생활프로그래밍 168쪽

5. 다양한 패키지로 데이터 분석하기 편!

 

분석에 특화된 모듈(라이브러리)

  • NumPy - 고성능 과학계산을 위한 데이터 분석 라이브러리
  • Pandas - 행과 열로 구성된 표 형식의 데이터를 지원하는 라이브러리
  • Matplotlib - 2D 그래프로 시각화가 가능한 라이브러리

파이썬 생활프로그래밍 교재로는 p171 참고.

NumPy

주요 기능

  • 빠르고 효율적인 벡터 산술연산을 제공하는 다차원배열 제공 (ndarray) 클래스
  • 반복문 없이 전체 데이터 배열 연산이 가능한 표준 수학 함수 (sum(), sqrt(), mean())
  • 선형대수, 난수 생성, 푸리에 변환

앞으로 길게 적을 필요없이 np라고만 적어줘도 된다.

 

numpy.ndarrya 클래스

  • 동일한 자료형을 가지는 값들이 배열 형태로 존재함.
  • N차원 형태로 구성이 가능하다.
  • 각 값들은 양의 정수로 색인(index)이 부여되어 있다.
  • numpy에서 차원(dimension)을 rank, axis라고 부르기도한다.
  • ndarray를 줄여서 array로 표현한다.

 

일단 우리에게 필요한 add함수가 담긴 모듈을 생성하자.

이렇게 적어준 다음,

File - download ad - python(.py) 를 눌러서 파이썬을 생성해주자.

해당 폴더를 열어서 이 파일을 작업중인 폴더로 옮겨주자.

 

원하는 노트북을 새로 생성하고, import module_test 를 입력해주면 방금전에 생성한 모듈을 사용할 수 있게 라이브러리 환경설정이 끝난다.

잘 불러와졌는지 테스트해볼까?

add함수가 잘 적용된 것을 확인할 수 있다.

 

이제 numpy를 불러와주자. 앞으로 numpy는 자주 쓰일 예정이니 sql의 알리아스처럼 as를 사용해서 별칭을 정해주고 사용하도록 할 것이다.

실습으로 들어가봅시다~!

 

1차원 np.array([1,2,3,4,5])

   → array([1,2,3,4,5])

2차원 np.array([[1,2,3],[4,5,6]])

   → array([[1,2,3],

       [4,5,6]])

여기서 잠깐, 차원을 모르겠어요!

괄호가 얼마나 둘러져있는가로 생각하시면 조금 쉬우실 겁니다.

 

뭔가.. 설명을 복합으로 다른것까지 끌어다 한 것 같은 느낌이 있긴 한데 -_-;;

아무튼, 색깔펜으로 동그라미 친것처럼 저렇게 차원을 나눈다고 보면 될 것 같다.

(아.. 나도 이해하는데 시간 걸렸지만 설명이 이렇게 어려운 거였구나. 책을 봐야겠다 ㅋㅋㅋ)

 

다시 이어서~

shape (배열의 크기 확인)

size (배열의 전체 요소 개수 확인)

dtype (배열의 타입을 확인)

ndim (배열의 차원을 확인해주는 함수 : Dimension)

사용할 때는 그림처럼 '변수명.함수이름' 형태로 입력하면 된다.

 

 

 

 

 

 

728x90
반응형
Comments