새소식

Interview

차원의 저주에 대해 설명해주세요

  • -

차원의 저주는 차원이 증가하면서 학습데이터 수가 차원 수보다 적어져 성능이 저하되는 현상이다.

데이터 차원이 증가할수록 공간의 크기가 증가하고 학습에 필요한 데이터수도 증가하게 된다.

그러나 학습 데이터 수는 고정되어있기 때문에 기존 데이터 간 거리가 멀어지고 빈 공간은 아무런 정보도 담겨있지 않은 0으로 채워지는 sparse한 현상이 발생한다.

정보가 없는 공간이 많아지기 때문에 학습을 하면 성능이 저하될 수 밖에 없다.

 

 

차원의 저주 문제를 해결하려면?

  • 더 많은 데이터를 추가
  • 차원 축소 기법을 사용한다. (PCA, LDA, LLE, MDS 등)

+ 차원 축소 기법에는 어떤 것들이 있나요?

 

 

728x90
Contents