1. 머신러닝 개념
- 머신 러닝이란 애플맅케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭합니다.
- 현실 세계의 매우 복잡한 조건으로 인해 기존의 소프트웨어 코드만으로는 해결하기 어려웠던 많은 문제점들을 이제 머신러닝을 이용해 해결해 나가고 있습니다.
- 특히 인간만이 가지는 인지능력만이 해결 가능하다고 여겨졌던 다양한 분야에서 머신러닝의 응용이 두드러지고 있으며 데이터 마이닝, 영상인식, 음석인식, 자연어 처리에서 머신러닝을 적용하며너서 급속하게 발전 하고 있습니다.
2. 머신러닝, 왜 필요한가?
- 현실 세계의 복잡한 업무와 규칙을 구현하기 위한 매우 복잡하고 방대한 코드
- 수시로 변하는 업무 환경, 정책, 사용자 성향에 따른 애플리케이션 구현의 어려움
- 많은 자원과 비용을 통해서 구현된 애플리케이션의 예측 정확성 문제
- 동일한 숫자라 하더라도 여러 변형으로 인해 숫자 인식에 필요한 여러 특징(feature)들을 if else 와 같은 조건으로 구분하여 숫자를 인식하기 어렵다.
- 머신러닝은 이러한 복잡한 문제를 데이터를 기반으로 숨겨진 패턴을 인지해 해결합니다.
-머신러닝 알고리즘은 데이터를 기반으로 통계적인 신뢰도를 강화학습 및 예측 오류를 최소화하기 위한 다양한 수학적 기법을 적용해 데이터 내의 패턴을 스스로 인지하고 신뢰도 있는 예측 결과를 도출해 냅니다.
3. 머신러닝의 분류
- 지도학습 : 결정값이 주어지는 학습 ( 예시 : '이 사진은 고양이야', '이 사진은 강아지야' 결과가 있음)
분류/회귀/시각/음성 감지/인지
- 비지도학습 : 결정값이 주어지지 않는 학습
군집화(클러스터링)/차원 축소
4. 머신러닝 기반의 예측 분석
- 머신러닝은 데이터를 관통하는 패턴을 학습하고, 이에 기반한 예측을 수행하면서 데이터 분석 영역에 새로운 혁신을 가져왔습니다.
- 데이터 분석 영역은 재빠르게 머신러닝 기반의 예측 분석으로 재편되고 있습니다.
- 많은 데이터 분석가와 데이터 과학자가 머신러닝 알고리즘 기반의 새로운 예측 모델을 이용해 더욱 정확한 예측 및 의사 결정을 도출하고 있으며, 데이터에 감춰진 새로운 의미와 인사이트를 발굴해 놀랄 만한 이익으로 연결시키고 있습니다.
5. 머신러닝의 단점
- 데이터에 너무 의존적이다. (편향된 데이터를 넣으면 편향된 결과가 나온다)
- 학습시에 최적의 결과를 도출하기 위해 수립된 머신러닝 모델은 실제 환경 데이터 적용 시 과적합 되기 쉽습니다.
- 복잡한 머신러닝 알고리즘으로 인해 도출된 결과에 대한 논리적인 이해가 어려울 수 있습니다.(머신러닝은 블랙박스)
- 데이터만 집어 넣으면 자동으로 최적화된 결과를 도출할 것이라는 것은 환상입니다. (특정 경우에는 개발자가 직접 만든 코드보다 정확도가 더 떨어질수 있습니다.) 끊임없이 모델을 개선하기 위한 노력이 필요하기 때문에 데이터의 특성을 파악하고 최적의 알고리즘과 파라미터를 구성할 수 있는 고급 능력이 필요합니다.
'머신러닝 > 머신러닝 개념' 카테고리의 다른 글
머신러닝을 위한 넘파이와 판다스의 중요성 (0) | 2021.08.09 |
---|