일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- conda base 활성화
- 오블완
- conda 기초 설정
- window netstat time wait 제거
- conda 가상환경 설정 오류
- conda base 기본 설정
- 티스토리챌린지
- 실행중인 포트 죽이기
- time wait port kill
- 려려
- 3000 port kill
- Today
- Total
목록K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) (29)
모도리는 공부중
저번시간 숙제 1. 시퀀스 길이 맞추기 2. 모델링 - LSTM - Dropout - Embedding 선생님 풀이 갑니다. ..... 잘.. 자버렸다.. ;;;;; 에너지 데이터 예측하기(시계열, RNN) 시간 흐름에 따라 발생하는 에너지 데이터를 예측해보자. import pandas as pd import numpy as np import matplotlib.pyplot as plt data = pd.read_csv('data/energy.csv') data.head() data.tail() data.shape out : (26304, 3) 2만 6천개의 데이터가 있음을 확인 완료. 시계열 데이터 파싱 # parse_dates : timestamp열을 그냥 글자 타입에서 date 날짜 타입으로 변경 ..
저번 시간 복습중.. 21.03.08. 딥러닝 - RNN 단어 철자 예측 및 뉴스기사 데이터 실습 cnn은 차원이 고차원데이터가 되더라도 학습이 가능하다. 이유는 무얼까? cnn은 특징을 추출해주는 레이어이다. cnn을 붙여서 활용할 수 있는 데이터는 이미지에 국한되지 않는다. 글씨, 소리 등에 studying-modory.tistory.com 현재 데이터와 과거 데이터가 같이 들어와서 연산을 하기 때문에 빙글빙글 도는 것이 순환하는 것과 같다고 하여 RNN이라고 부른다. 선형회귀의 경우 3시간을 공부하면 30, 8시간을 공부하면 80점을 맞을거야 라는 예측값이라면, 선형분류는 동그라미와 세모를 분류하는 결정경계이다. 현재는 직선 하나로 분류할 수 있는 이진분류이지만 만약 여기에 다른게 늘어난다면? 다중..
cnn은 차원이 고차원데이터가 되더라도 학습이 가능하다. 이유는 무얼까? cnn은 특징을 추출해주는 레이어이다. cnn을 붙여서 활용할 수 있는 데이터는 이미지에 국한되지 않는다. 글씨, 소리 등에도 해당이 된다. cnn과 복합적으로 많이 이용되는 RNN. 오늘은 이것에 대해 배워보도록 한다. 순환 신경망에 대해 알 수 있다. RNN 의 활용분야를 알 수 있다. Keras를 활용해 순환 신경망을 구성할 수 있다. 위의 예시를 보면 알 수 있듯이 실제 문장을 만들기 위해서는 단어 관계 사이를 알고 진행을 해야 한다. 문장을 듣고 무엇을 의미하는지 알아야 서비스 제공이 가능하다. 문장을 듣고 이해한다는 것은 많은 문장을 이미 학습해 놓았다는 것이다. 문장의 의미를 전달하려면 각 단어가 정해진 순서대로 입력되..
개, 고양이, 말 이미지 인식 - 개, 고양이를 학습했던 모델을 그대로 활용 오늘 수업 실습에 앞서서 먼저 어제 진행했던 파일을 복제하여 사용한다. 복제하는 방법은 그림으로 첨부. 그리고 동물이미지를 구하기 위해 아래의 캐글 사이트를 접속한다. www.kaggle.com/alessiocorrado99/animals10 Animals-10 Animal pictures of 10 different categories taken from google images www.kaggle.com 폴더명이 이태리어로 되어있다보니 '말' 폴더명이 horse가 아니고 cavallo로 되어있다. 폴더를 찾아서 열면 다음과 같이 이름이 제각기(물론 규칙이 있겠지만)로 되어있으니 사용 편의성을 위해 파일을 전체선택(ctrl+A..
전이학습(Transfer Learning) 전이학습이란 다른 데이터 셋을 사용하여 이미 학습한 모델을 유사한 다른 데이터를 인식하는데 사용하는 기법이다. 이 방법은 특히 새로 훈련시킬 데이터가 충분히 확보되지 못한 경우에 학습 효율을 높여준다. 사전학습모델을 이용하는 방법은 특성 추출(feature extraction)방식과 미세조정(fine tuning) 방식이 있다. VCG16의 구조 : 컨볼루션층 13개, MaxPooling 5개, Fully Connected Layer 4개로 구성 최종적으로 특성 맵의 크기는 (4, 4, 512) 컨볼루션 베이스 - 특성 추출 방식 (Feature Extractor) ← 우린 이 방식을 주로 사용한다. 전결합층 분류기 (Classfier) 전이학습 - 특성추출 방..
아래는 특허도 나온 것이라고 한다. 신경망 cnn구조 maxpooling flatten 학습 손글씨 데이터를 마무리짓고 개, 고양이로 넘어갑시다. 과대적합 방지 - Dropout 함수 활용 드롭아웃은 학습을 하는 동안에만 적용되고 학습이 종료된 후 예측을 하는 단계에서는 모든 유닛을 사용하여 예측한다. 노드가 많아지거나 층이 많아진다고 해서 학습이 무조건 좋아진다고 볼 수 없음 → 과적합 과적합을 해결하는 가장 좋은 방법 → Drop out (은닉층에 배치된 노드 중 일부를 사용하지 않게 하는 방법) from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout # Conv2D : 컨볼루션 연..
CNN (Convolution Neural Network)의 구조 CNN( 합성곱 은 입력된 이미지에서 특징을 추출하기 위해 마스크 필터를 도입하는 방법 이미지 전체 영역에 대해 서로 동일한 연관성 중요도 로 처리하는 대신 특정 범위에 한정해 처리한다면 훨씬 효과적일 것이라는 아이디어 제시 Convolution 은 비전에서 주로 filter 연산을 뜻하며 이미지의 특징(feature)를 찾기 위해 filtering을 수행 CNN (Convolution Neural Network ) 과정 특성맵 feature map ) : 합성곱 계층의 입출력 데이터 특성맵은 평면을 구성하는 2차원로 구성 → 채널 흑백으로 코딩된 경우 흑백의 그레이 스케일만 나타내면 되므로 깊이는 1 입력신호가 RGB 신호로 코딩된 경우..
저번 시간 정리.. # 퍼셉트론 1개로 구성된 신경망 # 넘파이 임포트 안했다면 해줄것 # (특성 데이터, 라벨 데이터, 반복수, 학습률) def fit_new(X, y, epochs, lr) : # (1) 파라미터 초기화(w,b) w = np.random.rand(1) b = np.random.rand(1) # epochs만큼 반복해서 학습 for i in range(epochs): # (3) 입력받는 X를 이용해서 y를 예측 (예측값y = pred_y) pred_y = w * X + b # (4) 오차 계산 (오차error = 실제값y - 예측값pred_y) error = y - pred_y print("반복수 : {}, 예측값 : {}, 오차 : {}".format(i, pred_y, error))..
저번시간 실습으로 했던 XOR논리 학습에 대한 수업 이어서 갑니다. X_xor = [[0,0],[0,1],[1,0],[1,1]] y_xor = [0,1,1,0] # 신경망 설계 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Activaion model3 = Sequential() model3.add(Dense(units=1, input_dim=2)) model3.add(Activation("sigmoid")) model3.summary() out : # 컴파일 model3.compile(loss="binary_crossentropy", optimizer="adam", metrics=["acc..
신경망 = 선형회귀 + Rogistic Regression 신경망은 굉장히 많은 수의 w*b가 있다. 이러한 문제로 딥러닝은 과적합에 자주 걸리는 문제점이 발생한다. create를 눌렀을 때 3.8만 뜬다면 update index를 눌러서 업데이트를 해준다. 버전을 3.6으로 맞추고 이름을 deep01로 설정해서 create. 설치하는데 시간이 걸리므로 이 작업을 선행 후 수업을 진행하겠습니다. not installed로 바꾸고 search packages에 다음을 입력하여 설치해준다. jupyter numpy pandas matplotlib seaborn scikit-learn opencv 3개 라이브러리 apply를 적용하면 내가 선택한 9개가 상단에 뜬다. 확인 후 한 번 더 apply. 설치가 끝..