'분류 전체보기' 카테고리의 글 목록 (16 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록모도리의 지식창고 전체보기 (199)

모도리는 공부중

21.01.15. 머신러닝 - 텍스트마이닝 세 번째 시간

저번시간 복습은 이 부분을 다시 한 번 훑어주셨다. GridSearch 내가 설정한 모든 조합을 다 돌려보는 방법. 모든 조합을 고려해서 세밀하고 촘촘하게 확인할 수 있다. RandomSearch 랜덤으로 돌려서 대략적인 구간 파악에 용이하며 빠른 시간 안에 확인이 가능하다. gridsearch를 하면 정교하게 찾다보니 시간이 오래 걸리므로 좋은 성능을 가진 컴퓨터로 돌려보는 것이 좋다. 어제 돌려놓은 코드가 지금쯤 전부 돌아가있을 것이니 결과를 가져와보자. grid = GridSearchCV(pipe_model, param_grid, cv=3) grid.fit(text_train,y_train) print(grid.best_score_) print(grid.best_params_) out : 0.893..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12 2021. 1. 15. 14:07

21.01.14. JSP&Servlet - 웹페이지 회원가입, 로그인

오늘 방문자 수 : 자, 이게 어제 숙제 내주기 전까지의 코드입니다. 값이 있다면 특정 값을 반영하지만 값이 없다면 null을 반환하게 된다. today가 null이라는 것은 application에 값을 한 번도 넣어주지 않았다는 뜻. null이 아니라는 것은 어떤 값이 들어갔다는 것을 의미한다. 이것을 활용하여 방문자수를 늘려줄 수 있다. 오늘 방문자 수 : 이제 새로고침할 때마다 방문자 수가 올라가게 설정 완료. 이 방문자 수가 모두가 공유되고 있는게 맞는지 모르겠다구요? (선생님의 주소를 공유해주심) 웹 프로젝트를 내부에 넣어서 홈페이지 실습을 해봅시다. import 팝업을 켜서 받은 파일 추가. 우리는 압축을 풀지 않은 상태로 진행할 것이기 때문에 Select root directory가 아닌 S..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/JAVA 2021. 1. 14. 17:03

21.01.14. 머신러닝 - 텍스트마이닝 두 번째 시간

저번시간에 다운로드한 영화리뷰데이터를 이용해서 오늘 수업 진행합니다. 앞 번호는 몇번 리뷰인지 알려주는 번호, 뒤 번호는 평점. 1~4점까지는 부정 리뷰라고 생각하여 부정폴더(neg)에 모두 모아놨다. 마찬가지. 대신 여기는 10~7점까지 긍정리뷰라고 판단하여 긍정폴더(pos)에 모두 모아놨다. 그렇다면 5,6점은 어디로 간걸까? - 애매한 판단. 긍정인지 부정인지 판단하기 어려운 평점이기 때문에 이 점수는 제외하고 뚜렷한 평가가 나타나는 점수만을 모아서 하는 것이 평가를 내릴 때 적합하다. 실제로는 판단 기준에 따라 5,6점도 필요할 수 있다. 하지만 오늘 수업할 부분은 실습 목표에 적합한 부분만 모았기 때문에 이처럼 빠지고 제외된 부분이 몇몇 있을 수 있으니 참고. 폴더 순서에 맞춰서 0번, 1번 이..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) 2021. 1. 14. 13:29

21.01.13. JSP&Servlet - Session 정보 지우기, 방문자수 올리기

- 저번시간 복습 - Session 특징 서버에 저장(Session) 값을 저장시 Object로 저장 브라우저당 1개씩 발급 보안에 강력하다. 많은 양의 데이터 저장 금융사이트는 5분, 보통 사이트는 30분이 지나면 로그아웃되는 모습을 봤을 것이다. 이게 바로 Session이 용량 최적화를 위해 하는 행동이자 보안을 지키는 방법. 어제 진행했던 코드를 다시 가져와서 설명을 이어가보도록 하자. 주석을 모두 제거하고 코드만 깔끔하게 가져와봤다. package com; import java.io.IOException; import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet.http..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/JAVA 2021. 1. 14. 09:04

21.01.12. JSP&Servlet - Cookie, Session

저번시간 복습 Cookie의 특징 문자만 넣을 수 있다. 보안에 매우 취약 개수가 한정적 (한 도메인당 24개) → 실제로 많이 쓰이지는 않음 Session의 특징 ☆ 서버의 (Session)영역에 저장 ☆ Object 저장 (업캐스팅 현상) Cookie보다 보안에 강력 ☆ 브라우저당 1개만 발급 많은 양의 데이터 저장 가능 (서버가 허용하는 한) cookie에 나이를 따로 주지 않으면 기본 설정은 1년이지만 브라우저를 종료하게 되면 사라진다. 하지만 cookie에 나이를 설정해주게 되면 브라우저를 종료하더라도 다시 실행했을 때 여전히 남아있는 것을 우리는 확인할 수 있었다. session은 서버에 저장되다보니 session이 많아지면 많아질수록 용량이 커진다. 이러한 이유로 session은 기본적으로 ..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/JAVA 2021. 1. 12. 16:18

21.01.12. 머신러닝 - Decision Tree, Bagging, Random Forest, Boosting

Decision Tree(결정트리) 직관적으로 이해하기 쉬운 알고리즘 데이터에 있는 규칙을 학습을 통해 자동으로 찾아냄 규칙은 예/아니오 로 대답할 수 있는 질문을 남김 매 / 펭귄 / 돌고래 / 곰을 나눠보자 Decision Tree(결정트리) 단점 결정트리는 수직적 구조로 인해 중간에 에러가 발생하면 다음 단계로 에러가 계속 전파 학습 데이터에 따라 생성되는 결정트리의 구조가 다르기 때문에 일반화하여 사용하기 어렵다. 결정트리는 과대적합을 막기 어렵다. Ensemble(앙상블) 앙상블(ensemble)은 여러 머신러닝 모델을 연결하여 더 강력한 모델을 만드는 기법 Decision Tree Ensemble(결정트리 앙상블) 개별 결정트리의 과대적합되는 단점을 보완하는 모델 다수결 법칙 또는 평균등으로 ..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) 2021. 1. 12. 14:19

21.01.11. Cookie & Server

아직 정리하지 못한 jsp & servlet는 일단 보류하고.. 오늘부터 새로운 파트! Cookie & Session Client가 Server로 요청하면 해당 Page를 Client에게 전송(응답)한 후 연결을 종료한다. 그렇기 때문에 우리는 웹페이지에서 개발자도구(F12)를 통해 편집이 가능하다. 바로 이렇게 ↓ 그럼 이렇게 연결이 끊기는데 우리가 로그인한 정보는 어떻게 이어지는걸까? Cookie & Session Client의 정보를 지속적으로 유지하기 위한 방법 client에 저장한다 → cookie server에 저장한다 → session 클라이언트에 저장되는 쿠키는 보안에 취약, 하지만 서버에 저장하는 세션은 보안이 강력하다. Cookie 전달할 데이터를 Web Browser(Client)로 ..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/JAVA 2021. 1. 11. 15:57

21.01.11. 머신러닝 - lasso, ridge, 선형 분류 모델

어제 수업에 이어서 - 규제 강화 (alpha) Lasso 일부특성 사용x Ridge 모든특성 사용 이러한 이유로 모든 특성을 사용하는 Ridge모델이 일반적으로 점수를 더 잘 내는 특징을 가지고 있다. # alpha = 1 ridge = Ridge(alpha = 1) ridge.fit(extend_X_train, y_train) print('train score : ',ridge.score(extend_X_train,y_train)) print('test score : ',ridge.score(extend_X_test,y_test)) # 사용한 특성의 개수 print('사용한 특성의 개수 : ',np.sum(ridge.coef_!=0)) out : train score : 0.91879276992388..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) 2021. 1. 11. 12:59

21.01.08. 머신러닝 - 선형모델학습

어제 수업한 파일에 이어서 수업 시작. 예측값 def h(w,x,b): return w * x + b 비용함수 평균제곱오차(MSE) def cost(data, target, weight, intercept): # MSE 구하기 # 시간, 점수, 가중치, 절편 y_pre = h(weight,data,intercept) # 예측값 # y_pre = weight * data + intercept return ((y_pre - target)**2).mean() # 평균제곱오차(MSE) # (예측 - 실제) ← 오차 # **는 제곱(^2)을 뜻함. mean()은 평균. # 기울기 10, 절편 0 cost(data['시간'],data['성적'],10,0) out : 0.0 # 기울기 12, 절편 5 cost(dat..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) 2021. 1. 8. 14:02

21.01.07. 머신러닝 개념복습, 데이터스케일링, 선형모델

머신러닝 개념 복습 머신러닝 ?? 데이터를 이용하여 특성과 패턴을 학습하고 그 결과를 바탕으로 새로운 데이터에 대해 결과를 예측하는 것 통계 기반 데이터 분석(기존) vs 머신 러닝 기반 데이터 분석(현재) 통계 기반 : 분석하는 사람의 지식에 따라 결과가 크게 달라질 수 있다. 머신러닝 기반 : 사람 + 머신러닝 (상대적으로 사람의 능력이 떨어져도 분석이 가능) 머신러닝 방법 지도학습 : 문제와 답(label)을 함께 보여주고 학습하는 방법 회귀 : 정답 데이터가 수치형 데이터 (ex. 키, 몸무게, 부동산가격) 분류 : 정답 데이터가 범주형 데이터 (ex. 등급, 학점(ABCD)) 비지도학습 : 답이 없는 데이터를 가지고 패턴을 찾고 싶을 때 사용하는 방법 군집 : 비슷한 데이터를 묶어서 그룹별 패턴..

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/PYTHON(웹크롤링, 머신·딥러닝) 2021. 1. 7. 16:16

Prev 1 ··· 13 14 15 16 17 18 19 20 Next

목록모도리의 지식창고 전체보기 (199)

모도리는 공부중

티스토리툴바