R언어 시각화 통계 입문
동그랑땡의 github 자세히보기

동그랑땡의 데이터 데이터 데이터/통계 이해땡 9

통계에서 신뢰성 Reliability 정의 | 일관성(consistency) | 상호교환적

📍현재 위치 : 측정 > 신뢰성 검토신뢰성(Reliability)이란?신뢰성은 교육학 분야의 고전검사이론에서 발전한 개념이다. 고전검사이론에 따르면 우리가 측정하여 얻은 측정값은 아래와 같이 이뤄져 있다. $측정값 X = 실제값 T(True value) + 무작위 오차 \epsilon$ 우리가 측정을 하는 이유는 결국 실제값을 알아내고 싶기 때문이다. 그러므로 측정값에 무작위오차 보단 실제값이 훨씬 많이 포함되어 있길 바란다. 신뢰성은 이러한 면에서 측정의 유용성을 판단하는데 사용한다. 신뢰성 $\rho = \frac{Var(T)}{Var(X)}$ 측정값의 분산 중 실제값의 분산 비율을 측정함에 따라 측정값에 실제값이 얼마나 포함되어있는지 알려준다. 신뢰성이 높다는 것은 측정의 일관성(consistenc..

메트릭 척도, 리커트 척도 | metric, monadic, Likert scale 정의 & 설명/예시 + 종류

📍현재 위치 : 측정 > 척도 > 척도방법에 따른 분류 > 메트릭척도(metric scale) 잠깐 들어가기 전에 척도에 대한 개념을 잡아야한다면 아래 글을 읽어보자. 측정과 척도, 그 애매함에 관해...(+ 척도의 종류) 설명, 정의 📍현재 위치 : 측정 > 척도 > 척도방법에 따른 분류 측정은 왜 하는 것일까? 통계학에서 측정 measurement을 하는 이유는 개념, 즉 가설을 검증하고 싶기 때문일 것이다. 예를 들어, '상품 판매수는 oooo12.tistory.com 척도에 대한 개념이 잡혔다면, 아래 글을 통해 비메트릭 척도에 대한 이해를 가져가보자. 메트릭 척도를 이해하는데 도움을 준다. 비메트릭 척도, 비교척도 방법| non-metric scale, comparative scale 정의 & ..

비메트릭 척도, 비교척도 방법 정의 & 설명/예시 + 종류

📍현재 위치 : 측정 > 척도 > 척도방법에 따른 분류 > 비메트릭척도(non-metric)척도는 무엇인가?비교척도, 비메트릭 척도를 이해하려면, 척도(scale)에 대한 이해가 필요하다. 아래 글에서 척도는 물론 측정이 왜 필요한지에 대해 알아보자. 측정과 척도, 그 애매함에 관해...(+ 척도의 종류) 설명, 정의📍현재 위치 : 측정 > 척도 > 척도방법에 따른 분류 측정은 왜 하는 것일까? 통계학에서 측정 measurement을 하는 이유는 개념, 즉 가설을 검증하고 싶기 때문일 것이다. 예를 들어, '상품 판매수는 oooo12.tistory.com비메트릭 척도(non-metric scale)란?metric은 meter의 변형이다. meter는 measure를 어원으로 한다. 직역하자면 '측정'이겠..

측정과 척도, 그 애매함에 관해...(+ 척도의 종류) 설명, 정의

📍현재 위치 : 측정 > 척도 > 척도방법에 따른 분류 측정은 왜 하는 것일까? 통계학에서 측정 measurement을 하는 이유는 개념, 즉 가설을 검증하고 싶기 때문일 것이다. 예를 들어, '상품 판매수는 상세페이지 방문자수와 관계가 있다.'라는 가설을 세웠다고 하자. 이러한 가설은 검증하지 않더라도 옳은 개념이라는 걸 직관적으로 알 수 있다. 하지만, 이를 통계적으로 확인할 수 있다면 더 확신을 갖게 될 것이다. 이 관계가 맞는지 확인하려면 두 변수를 측정해야 할 것이다. 상품 판매수를 측정하고, 해당 상품의 상세페이지 방문자수를 측정하여 plot을 그려보자. 상품 판매수를 Y, 해당 상품의 상세페이지 방문자수를 X로 두고 plot을 그려보면 한눈에 두 변수간 관계가 있는지 확인할 수 있다! 척도는..

바이오신약에서 위험비와 위험률 알아보기 (신뢰구간, p값, 통계 검정)

바이오 관련 기사에 ‘위험비’라는 단어가 상당히 많이 나온다. 아무래도 신약에 있어서 제일 중요한 것은 ‘위험하지 않다.’일 것이다. 이러한 면을 판단하는 위험비에 대해 알아보았다. 위험비(Hazard ratio) 위험비(Hazard ratio)는 실험군의 위험률을 대조군의 위험률로 나눈 값이다. 만약 위험비가 1이면, 실험군과 대조군이 동일한 위 험률을 가진다는 의미다. 만약 위험비가 1보다 크다면, 실험군의 위험율이 증 가한다는 의미다. 만약 위험비가 1보다 작다면, 실험군의 위험율이 감소한다는 의미다. 위험률(Hazard Rate) 위험률(Hazard rate)는 일정 시간 간격에서 종료점의 사건이 발생할 확률을 시간 단위 기간으로 나눈 값이다. 종료점 디파글리플로진이라는 혈당강하제의 종료점 예시를..

변수 variable와 동의어들: 입력변수, 피쳐, 독립변수, 종속변수, 출력변수

통계를 배우면서 가장 어려운 부분 중 하나가 용어정리이다. 특히 같은 뜻임에도 다른 표현으로 나타나 있어서 매우 헷갈린 기억이 많다. 변수(variable)는 말 그대로 '변하는 수'이다. 통계학습은 두 변수의 관계를 유추해 나가는 것이다. $Y=f(X)$에서 $f$를 추정하는 기법이 통계학습이라고 지난 포스팅에서 다룬 바 있다. [통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적) 상관관계(Correlation)야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 예를 들어, 'X번 야식을 먹으면, 몸무게 oooo12.tistory.com $Y=f(X)$에는 변수 Y와 X가 존재한다. 여기서..

[통계 이해땡] 모수적 방법 (Parametric Method) + 모수(parameter)는 무엇인가

✍️ 2023. 10. 20 내용 수정 모수적 방법에 대해 알기전에 모수 Parameter에 대해 알면 좋다. Parameter라는 단어는 꽤 여러가지 의미를 갖게 되는데 이에 대해선 나중에 언급하도록 하겠다. 모수 Parameter 우리는 모집단 population을 추정하기 위해 표본 sample을 뽑아 조사한다. 선거날 출구조사를 생각해보자. 선거종료 후 개표를 통해 모집단(대한민국 선거인구)이 누굴 뽑았는지 알 수 있지만, 조금 더 빨리 결과를 확인하기 위해 선거하는 사람들 중 몇 명(표본)만 추려서 조사하고 투표가 끝나자마자 출구조사를 공개한다. 만약 출구조사를 통해 A후보가 선출되었다고 발표했다면 이 정보는 통계량(Statistics)이 된다. 그런데, 막상 투표를 까보니 B후보가 선출되었다...

[통계 이해땡] 지도학습 vs 비지도학습(Supervised Learning, Unsupervised Learning)

지도학습과 비지도학습으로 분류할 수 있는 통계학습(Statistical Learning)은 함수 f를 추정하는 일련의 기법을 의미한다. 함수 f는 $Y=f(X)$에서의 함수 f를 의미한다. 통계학습에 대해서는 아래 글에서 조금 더 상세하게 언급했다. [통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적) 상관관계(Correlation) 야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 우리는 보통 '얼마나 여러 번 야식을 먹 oooo12.tistory.com 입력변수(input), 출력변수(output) $Y=f(X)$에서 $X$는 입력변수(Input), $Y$는 출력변수(Output)에 해..

[통계 이해땡]예측 vs 추론(통계학습(Statistical Learning)의 목적)

상관관계(Correlation) 야식과 몸무게에 상관관계가 있다고 생각하는가? (난 매우 그렇다고 생각한다.) 그렇다면 어떤 상관관계가 있는지 알고 싶을 수 있다. 예를 들어, 'X번 야식을 먹으면, 몸무게가 Y(kg) 늘어난다.‘ 는 명확한 상관관계를 찾아낸다면, 우리는 야식을 줄일 수 있을지도 모른다. 상관관계를 알려면 어떻게 해야할까. 몸무게를 출력변수 Y, 야식 횟수를 입력변수 X로 놓는다. 그런 다음, Y와 X의 관계를 함수로 표현하면 된다! 통계학습(Statistical Learning) $Y = f(X)$ 이 때 함수 f를 추정하는 일련의 기법을 통계학습(Statistical Learning)이라고 한다. (Statistical Learning(통계학습)은 그 이름이 Machine Learn..

});