R언어 시각화 통계 입문
동그랑땡의 github 자세히보기

통계학 4

변수 variable와 동의어들: 입력변수, 피쳐, 독립변수, 종속변수, 출력변수

통계를 배우면서 가장 어려운 부분 중 하나가 용어정리이다. 특히 같은 뜻임에도 다른 표현으로 나타나 있어서 매우 헷갈린 기억이 많다. 변수(variable)는 말 그대로 '변하는 수'이다. 통계학습은 두 변수의 관계를 유추해 나가는 것이다. $Y=f(X)$에서 $f$를 추정하는 기법이 통계학습이라고 지난 포스팅에서 다룬 바 있다. [통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적) 상관관계(Correlation)야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 예를 들어, 'X번 야식을 먹으면, 몸무게 oooo12.tistory.com $Y=f(X)$에는 변수 Y와 X가 존재한다. 여기서..

[통계 이해땡] 모수적 방법 (Parametric Method) + 모수(parameter)는 무엇인가

✍️ 2023. 10. 20 내용 수정 모수적 방법에 대해 알기전에 모수 Parameter에 대해 알면 좋다. Parameter라는 단어는 꽤 여러가지 의미를 갖게 되는데 이에 대해선 나중에 언급하도록 하겠다. 모수 Parameter 우리는 모집단 population을 추정하기 위해 표본 sample을 뽑아 조사한다. 선거날 출구조사를 생각해보자. 선거종료 후 개표를 통해 모집단(대한민국 선거인구)이 누굴 뽑았는지 알 수 있지만, 조금 더 빨리 결과를 확인하기 위해 선거하는 사람들 중 몇 명(표본)만 추려서 조사하고 투표가 끝나자마자 출구조사를 공개한다. 만약 출구조사를 통해 A후보가 선출되었다고 발표했다면 이 정보는 통계량(Statistics)이 된다. 그런데, 막상 투표를 까보니 B후보가 선출되었다...

[통계 이해땡] 지도학습 vs 비지도학습(Supervised Learning, Unsupervised Learning)

지도학습과 비지도학습으로 분류할 수 있는 통계학습(Statistical Learning)은 함수 f를 추정하는 일련의 기법을 의미한다. 함수 f는 $Y=f(X)$에서의 함수 f를 의미한다. 통계학습에 대해서는 아래 글에서 조금 더 상세하게 언급했다. [통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적) 상관관계(Correlation) 야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 우리는 보통 '얼마나 여러 번 야식을 먹 oooo12.tistory.com 입력변수(input), 출력변수(output) $Y=f(X)$에서 $X$는 입력변수(Input), $Y$는 출력변수(Output)에 해..

[통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적)

상관관계(Correlation) 야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 예를 들어, 'X번 야식을 먹으면, 몸무게가 Y(kg) 늘어난다.‘ 는 명확한 상관관계를 찾아낸다면, 우리는 야식을 줄일 수 있을지도 모른다. 상관관계를 알려면 어떻게 해야할까. 몸무게를 출력변수 Y, 야식 횟수를 입력변수 X로 놓는다. 그런 다음, Y와 X의 관계를 함수로 표현하면 된다! 통계학습(Statistical Learning) $Y = f(X)$ 이 때 함수 f를 추정하는 일련의 기법을 통계학습(Statistical Learning)이라고 한다. (Statistical Learning(통계학습)은 그 이름이 Machine Learn..

});