회귀
-
결정계수! 너 대체 정체가 뭐야! 머신러닝을 처음 공부하기 시작하면 막히는 부분이 있다. 바로 결정계수이다. 확률을 심도 있게 배우지 않은 학생들은 모두 결정계수에서 좌절한 후, 머신러닝은 역시 공대생의 것이라며 프로그래밍을 포기하곤 한다. 그래서 오늘, 결정계수를 최대한 쉽게 설명하는 글을 적어보려 한다. 결정계수 = R제곱 통계량 = Coefficient of Determination = R^2 = R squred 이름도 많다... 한 줄로 설명하자면, 결정계 수란 = '회귀 모델의 성과 지표' 1에 가까울 수록 좋은 회귀 모델 0에 가까울 수록 나쁜 모델 음수가 나올경우, 바로 폐기해야 하는 모델 결정계수를 구하는 공식은 아래와 같다. 여기서 주의깊게 봐야 할 부분은 바로 이 부분이다. 결정계수의 ..
[쉬운 설명]머신러닝 결정계수(R^2) 뜻, 증명결정계수! 너 대체 정체가 뭐야! 머신러닝을 처음 공부하기 시작하면 막히는 부분이 있다. 바로 결정계수이다. 확률을 심도 있게 배우지 않은 학생들은 모두 결정계수에서 좌절한 후, 머신러닝은 역시 공대생의 것이라며 프로그래밍을 포기하곤 한다. 그래서 오늘, 결정계수를 최대한 쉽게 설명하는 글을 적어보려 한다. 결정계수 = R제곱 통계량 = Coefficient of Determination = R^2 = R squred 이름도 많다... 한 줄로 설명하자면, 결정계 수란 = '회귀 모델의 성과 지표' 1에 가까울 수록 좋은 회귀 모델 0에 가까울 수록 나쁜 모델 음수가 나올경우, 바로 폐기해야 하는 모델 결정계수를 구하는 공식은 아래와 같다. 여기서 주의깊게 봐야 할 부분은 바로 이 부분이다. 결정계수의 ..
2021.09.18 -
1. 최근접 이웃 알고리즘이 필요한 이유 일단 선형 회귀 분석이 왜 필요한지 이해해야 한다. 머신 러닝을 공부하는 사람이라면 K-최근접 알고리즘을 사용하여 테스트 데이터의 타깃 값을 알아내는 걸 첫 번째로 공부했을 것이다. 하지만, k최근접 알고리즘의 한계는 바로, 트레인 데이터 범위 밖의 테스트 데이터의 값의 타깃 값을 알아낼 수 없다는 것이다. 예를 들자면, 개미의 길이 별 무게 데이터를 가지고, 새로운 개미의 무게를 측정하는 프로젝트가 있다고 하자. 우리가 가지고 있는 교육 데이터는 다음과 같다. 길이 무게 1cm 1g 2cm 2g 3cm 3g 만약 k최근접 알고리즘을 사용하여 주변의 3개의 데이터 값을 참고하여 길이 4cm인 개미의 무게를 측정한다고 해보자. k최근접 알고리즘의 예측값은 가장 근접..
[간단 설명]k-최근접 이웃 알고리즘, 선형 회귀 분석, 다항 회귀 분석이 전부 왜 필요할까?1. 최근접 이웃 알고리즘이 필요한 이유 일단 선형 회귀 분석이 왜 필요한지 이해해야 한다. 머신 러닝을 공부하는 사람이라면 K-최근접 알고리즘을 사용하여 테스트 데이터의 타깃 값을 알아내는 걸 첫 번째로 공부했을 것이다. 하지만, k최근접 알고리즘의 한계는 바로, 트레인 데이터 범위 밖의 테스트 데이터의 값의 타깃 값을 알아낼 수 없다는 것이다. 예를 들자면, 개미의 길이 별 무게 데이터를 가지고, 새로운 개미의 무게를 측정하는 프로젝트가 있다고 하자. 우리가 가지고 있는 교육 데이터는 다음과 같다. 길이 무게 1cm 1g 2cm 2g 3cm 3g 만약 k최근접 알고리즘을 사용하여 주변의 3개의 데이터 값을 참고하여 길이 4cm인 개미의 무게를 측정한다고 해보자. k최근접 알고리즘의 예측값은 가장 근접..
2021.09.18