첫 시간에는 패턴인식을 배웠습니다. 내용은 더있지만 정리를 다 못해서 나중에 필요하다 느끼면 추가가 될 예정입니다.
1. 패턴인식 : 주어진 데이터의 집합의 입력을 바탕으로 특정한 기준으로 여러개의 그룹으로 분류하는것을 말합니다.
1) 패턴을 인식하기 위해 처음에는 샘플 데이터를 수집하는 작동을합니다.
*보통 수집한 샘플은 두가지의 분류로 나뉘는데 훈련집합과 테스트 집합으로 나뉩니다.
- 훈련 집합 : 인식기(분류기)를 만드는데 사용되는 집합
- 테스트 집합 : 인식기(분류기)를 만든후에 테스트하는데 사용되는 집합
2) 특징(모델)들을 정합니다
* 너무 많은 특징을 사용한다고 좋은것은 아닙니다.
* 쓸모 없는 특징이 있을수도 있습니다.
* **차원의 저주가 일어나는 경우가 많다.
3) 특징들을 토대로 분류기를 생성하고 그것을 이용하여 학습을 시킵니다.
* 학습 : 분류기의 특징(모델) 선택이 끝났다면 분류기를 학습시킵니다.
* 학습에 사용하는 정보는 훈련집합을 이용합니다.
4) 성능을 평가합니다.
패턴인식은 내용이 별로없어서 내용중에 중요한 차원의 저주에 대해 조금더 정리를 해보겠습니다.
차원의 저주? 같은 데이터의 양을 갖고있더라도 차원이 증가하면 그 데이터가 차지하는 차원의 데이터양은 적기 때문에 원하는 결과값을 얻기위해서는 더 많은 양의 데이터가 필요로합니다. 그래서 복잡해지기 때문에 이것을 차원의 저주라고 합니다.
'머신러닝 > Tensorflow' 카테고리의 다른 글
| 1. 머신러닝이란? (0) | 2018.05.03 |
|---|