모도리는 공부중

20.11.03. 오후 - 빅데이터 특강 본문

K-디지털 빅데이터 분석서비스 개발자과정 20.11.02~21.04.12/기타 등등

20.11.03. 오후 - 빅데이터 특강

공부하는 모도리 2020. 11. 3. 16:07
728x90
반응형

BIGDATA + AI

 

빅데이터에서 가장 중요한 건 정보수집이다.

1. 데이터수집

2. 정리 - 가공처리

3. 저장

 

제4차 산업혁명 (제2차 정보혁명) 2015년

 

현존하는 데이터의 90%는 2016년 이후 생성된 것 (IBM)

발생데이터 90%가 비정형데이터. 

 

 

 

책 FACTFULNESS 팩트풀니스

 

앞으로는 문맹의 의미가 달라질 것이다. 데이터 문맹..

 

데이터가 쌓이고 쌓이면 예측할 수 없었던 것도 예측가능하도록 만들어진다.

 

어느 검색엔진(구글)에서 키워드검색 지역과 검색빈번도를 이용해 예측을 해보았다.

Google Flu Trends

한 번은 그 어느곳보다 빠르고 정확하게 예측했지만 지금은 x.

전공자가 아닌 이상 정확한 예측은 어려움을 나타내준다.

해당 전공자가 다룰줄 알아야한다는 것.

 

 

인공지능 중에 알파고보다 먼저 나온 watson.

원래 퀴즈 쪽이었지만 의료를 넣어보자 진단 정확도가 2016년에 90% 이상.

그래서 실제로 현직에서 사용해보니 18년 도입건수 0.(기대에 못 미치기 때문)

일부 병원에서는 진단 정확도가 매우 저조.

대체 뭘 대상으로 진단했을까? - 미국에 사는 성인 남녀를 대상으로 했기 때문.

 

정말 좋은 알고리즘이라 해도 데이터의 부족으로 환경에 맞지 않는 결과가 나오는 것.

지금은 한국 데이터를 넣어서 80%까지 상승했다고는 한다.

 

 

빅데이터 분석은 그럼 대체가 아닌가?  기존의 방법은 대체할 수 없지!

- 기존의 방법 문제점을 보완함으로써 여러가지 분석의 조합을 통해 더 나은 결과를 얻고자 하는 도구가 바로 빅데이터인 것이다.

 

인공지능은 아직 위험하다!

미인대회에서 기존 데이터를 학습시켜 해봤더니.. → 온통 백인만 뽑아버렸다.

학습된 데이터 안에서만 하다보니 이런 결과가 나와버린 것.

사람은 그렇지 않으니.. 인공지능에겐 잘못된 데이터를 학습시켰을 때 더 어려움.

사람을 대체하는 서비스?? No! 사람이 편하고자 사용하는 것이지 사람을 불편하게 하는 것은 사용할 필요x.

 

앞으로 만들고자 하는 지능업종은 도덕성을 학습시켜야하므로 개발자의 판단이 잘못되어 있으면 위험하다.

개발자들의 윤리가 앞으로는 매우 중요한 시기!

 

첫번째 프로젝트는 주어지고

두번째 프로젝트는 우리가 할 거고

세번째 프로젝트는 기업에서 가져올거다..

 

필요한 멘토가 있다면 말씀주셔라! 공부에 필요한 요구는 다 들어주겠다~

728x90
반응형
Comments