<Introduction>
어떤 일이든 하다 보면, 어느 시점에서 드는 항상 드는 생각이 있습니다.
"기본이 정말 중요하구나"
독립변수와 종속변수에 대해 중고등학교 과학 시간에도 익히 들었던 개념입니다. 이 두 변수에 대해서는 통계에 기반한 인공지능을 이해할 때 반드시 숙지해두어야 하는 개념이라 생각하여 정리하게 되었습니다.
<독립변수>
독립변수는 입력값(X)이나 원인으로 고려되는 변수로 설계자, 연구자가 변화시키는 변수를 말합니다.
예를 들어, 근육은 어떻게 하면 키우지? 라고 어느 날 생각했습니다.
근육이 크려면, 잘먹어야하나?, 운동을 열심히 해야 하나?, 영양제를 잘 챙겨 먹어야 하나?, 세트 간 쉬는 시간을 줄여야 할까? 등등..
근육이 키우기 위한 여러가지 예상되는 행위들이 떠오릅니다.
이때, 이러한 예상되는 행위들이 하나하나가 독립변수라고 할 수 있습니다. 원인으로 고려되는 변수들인 것이죠.
<종속변수>
종속변수는 출력값(Y)이나 결과로 고려되는 변수로 독립변수에 의해 영향을 받는 변수를 말합니다.
설계자, 연구자가 독립변수의 변화에 따라 어떻게 변하는지 보고자 하는 변수가 되겠습니다.
<독립변수>에서 저는 근육은 어떻게 하면 키우지? 라는 궁금증이 생겼습니다.
그에 대한 독립변수로, 영양, 운동량, 영양제 보충, 세트 간의 휴식시간이라는 독립변수를 떠올렸습니다.
이는 결국 근육량 이라는 종속변수가 독립변수에 의해 어떻게 변하는지, 상관관계를 보고 싶었던 겁니다.
<독립변수와 종속변수의 관계>
결국 독립변수와 종속변수는 우리(연구자)가 궁금한 문제를 통계적인 모델로 세울 때 사용되는 변수라고 할 수 있습니다.
이는, 두 변수는 인과 관계에 있다는 것을 정의를 통해 알 수 있고, 두 변수의 관계를 밟혀 내는 것이 우리의 최종적인 목적이라 할 수 있을 겁니다.
결론적으로 독립변수와 종속변수는 인과 관계를 가지고 있습니다.
우리의 최종적인 목적은 궁금증 해결, 즉 두 변수간의 관계를 밝혀내야 하는 것이죠.
어떻게?? 밝혀 낼지를 상관관계분석, 회귀분석을 통해 밝혀냅니다.
다음 포스트에서 이 두 방법에 대해 작성 하고자 합니다.
<독립변수와 종속변수을 부르는 여러 가지 용어>
독립변수 = 설명변수 = 예측변수 = 위험인자 = 공변량(데이터가 연속형 자료일 때) = 요인(데이터가 범주형 자료일 때)
종속변수 = 반응변수 = 결과변수 = 표적변수
<참고 자료>
https://drhongdatanote.tistory.com/14
'통계' 카테고리의 다른 글
[통계] 상관분석? 회귀분석? (1) | 2022.02.14 |
---|