'이렇게 쉬운 거였어?' 종속변수·독립변수·매개변수 예시
종속변수·독립변수·매개변수 예시
종속변수·독립변수·매개변수 예시를 설명할 수 있는 예는 많습니다. 이번 글에서는 '온라인 쇼핑몰의 제품판매량을 구하려고 하는 마케터'를 예로 들어보겠습니다.
마케터 A씨는 광고비에 따라 제품판매량이 어떻게 변하는지 알고 싶어합니다. 그래서 A씨는 광고비를 평소보다 2배 써보기도 하고, 3배 써보기도 했습니다. 그 결과, 광고비를 3배 썼을 때 제품판매량이 늘었다는 걸 확인하게 됐습니다.
A씨가 한 행동과 결과를 간단한 수식으로 표현하면 다음과 같습니다.
제품판매량 = 2 x 광고비
제품판매량 = 3 x 광고비
위 3개를 종속변수·독립변수·매개변수로 표현해 볼 수 있습니다.
종속변수란? '내가 알고 싶어 하는 값'
문자 그대로입니다. 종속변수란 내가 알고 싶어 하는 값입니다.
마케터 A씨는 제품판매량을 알고 싶어 했습니다. A씨가 알고 싶어 했던 값은 '제품판매량'입니다. 알고 싶어 했던 값이 제품판매량이기 때문에, 제품판매량을 종속변수라고 할 수 있습니다.
독립변수 정의와 예시
그렇다면 독립변수는 뭘까요? 독립변수는 종속변수에 영향을 주는 값이라고 생각하면 됩니다. 앞서 A씨는 총 두 가지 행동을 했죠? A씨는 광고비를 2배·3배 늘려 봤습니다.
그 결과 3배 쓴 결과가 제품판매량이 늘었다는 결론을 내게 됐고요. 여기서 '광고비'는 독립변수라고 할 수 있습니다.
독립변수는 종속변수에 영향을 주는 값입니다. 광고비라는 독립변수가 제품판매량에 영향을 줬기 때문에, 광고비는 독립변수라고 할 수 있습니다.
조금 더 나아가자면, 독립변수는 이름에서도 알 수 있듯이 '독립' 됐습니다. 독립변수는 한 개가 아니라, 여러 개가 될 수 있습니다.
예컨대 제품판매량에 영향을 줄 수 있는 건 광고비 뿐만이 아닙니다. 광고비 외에도 유통 채널 수, 제품 가격 등이 있겠죠. 유통 채널 수에 따라 종속변수(제품판매량)에 영향을 줄 것이고, 제품 가격 또한 종속변수에 영향을 줄겁니다. 그래서 유통 채널 수와 제품 가격은 독립변수라고 할 수 있습니다.
여기서 잠깐, 다음 두 가지 물음에 대해 생각해 보는 시간을 가져보겠습니다.
유통 채널 수가 달라진다고 해서 광고비는 어떤 영향을 받을까?
제품 가격이 달라진다고 해서 광고비는 어떤 영향을 받을까?
아마 위 두 질문에 딱 떨어지는 답이 생각나지 않으셨을 겁니다. 이처럼 독립변수는 각각의 독립변수에 영향을 미치지 않습니다. 광고비는 유통 채널 수에 영향을 미치지 않고, 유통 채널 수는 제품 가격에 영향을 미치지 않죠.
종속변수에는 영향을 미치면서도 각각의 독립변수에는 영향을 미치지 않는 것. 각 변수가 '독립' 되었기 때문에, 독립변수라고 합니다.
독립변수 개념을 정리하면, 다음과 같습니다.
독립변수는 종속변수에 영향을 미친다.
각각의 독립변수는 서로에게 영향을 미치지 않는다.
매개변수 의미와 예시
매개변수는 통계학에서 중요한 개념 중 하나입니다.
이는 독립변수와 종속변수 사이에서 중간 역할을 하는 변수를 의미합니다. 좀 더 구체적으로 설명하자면, 매개변수는 독립변수의 영향을 받아 변화하고, 이어서 종속변수에 영향을 미치는 변수입니다.
이 개념을 이해하기 위해 앞서 언급한 마케터 A씨의 예시를 조금 더 발전시켜 보겠습니다.
A씨는 광고비와 제품판매량의 관계를 분석하던 중, 이 두 변수 사이에 또 다른 요소가 있을 수 있다고 생각했습니다. 바로 '브랜드 인지도'입니다.
이를 단계별로 설명하면 다음과 같습니다:
광고비 증가 → 브랜드 인지도 상승
브랜드 인지도 상승 → 제품 판매량 증가
이 관계에서 각 요소의 역할은 다음과 같습니다:
광고비: 독립변수
제품 판매량: 종속변수
브랜드 인지도: 매개변수
브랜드 인지도는 광고비에 의해 영향을 받으면서, 동시에 제품 판매량에 영향을 줍니다. 이처럼 매개변수는 독립변수와 종속변수 사이에서 '매개' 역할을 수행합니다.
매개변수는 종속변수에 영향을 주지만, 독립변수처럼 '직접' 영향을 주지 않습니다. 직접 종속변수에 영향을 주는 것은 '독립변수'이고, '간접'적으로 종속변수에 영향을 주는 건 매개변수라고 이해하면 됩니다.
계수? 절편? 이건 또 뭘까
종속변수·독립변수·매개변수를 이해했으면, 계수와 절편도 아셔야 합니다. 계수와 절편 역시 위 개념을 사용하면, 반드시 만나게 되는 개념이기 때문입니다.
계수란?
계수는 독립변수의 '정도'를 조절하는 값입니다.
예를 들어 ChatGPT 모델에 영향을 미치는 파라미터 중에는 'n='이라는 파라미터가 있습니다. 이 파라미터 안에 어떤 숫자를 넣느냐에 따라 답변 수가 달라집니다.
'n=1'이라고 하면, 답변을 1개만 출력하고, 'n=2'라고 입력하면 답변을 2개 출력합니다. 여기서 1과 2를 '계수'라고 합니다. 계수는 독립변수의 '정도'를 바꾸는 값이라고 생각하면 됩니다.
절편이란?
절편은 모든 독립변수가 0일 때 종속변수의 값을 나타냅니다. 예를 들어, 제품 판매량 = (3 x 광고비) + 5 에서 5가 절편입니다.
이는 광고비가 0일 때도 기본적으로 5개의 제품이 판매된다는 의미입니다. 실제 데이터 분석에서 절편은 모델의 기본 상태나 시작점을 나타내는 중요한 요소입니다.
식 하나로 이해하는 종속변수·독립변수·매개변수·절편·계수
제품판매량 = (3 x 광고비) + 5
제품판매량 : 종속변수
3 : 계수
광고비 : 독립변수(매개변수)
5 : 절편
마케터 A씨가 구하고 싶은 것은 제품판매량이었습니다. 그래서 광고비를 2배, 3배 조절했죠. 여기서 제품판매량은 종속변수이고, 2배·3배와 같은 숫자는 독립변수에 영향을 미치는 계수라고 할 수 있습니다.
종속변수에 영향을 미치는 광고비는 독립변수라고 할 수 있고요. 마지막으로 5라는 숫자는 광고비처럼 특정 요소로 지칭하지 않았지만, 제품판매량에 영향을 미치는 절편이라고 할 수 있습니다. 절편은 종속변수에 영향을 미치면서도 독립변수에 영향을 미치지 않는 것입니다.