stack overflow란?

while(alive){ code();

통계 22

최대우도법(MLE, Maximum Likelihood Estimation)

최대우도법 어떤 확률변수에서 표집한 값들을 토대로 각 가설마다 계산된 우도값 중 가장 큰 값을 고르는 통계적 추정방법 우리가 알고 싶은 데이터 Θ(모수)가 있다고 할 때, 여러 관측치들을 통해서 그러한 관측치가 나오게 하는 가장 그럴 듯한 값(가능성이 높은 값)을 추정하는 것. ※ likelihood function을 최대화하는 것 예시) 남자들로 구성된 한 집단의 몸무게(x)를 측정한 다음 평균과 분산(파라미터 θ)을 추정하고자 한다. - 어떤 분포가 더 잘 어울릴까? , 단 정규분포(주어진 PDF, 확률밀도함수)를 따른다고 가정한다. 바꿔서 말하면 어떤 평균과 분산값이 가장 이 데이터를 잘 표현하는가를 찾는 것이다. 우도 Likelihood 우도(likelihood)는 데이터가 이 분포로부터 나왔을 ..

통계 2024.04.12

ANOVA 분산분석

ANOVA 두모집단 평균 비교는 2 sample t-test를 사용함, 3개 이상의 모집단 평균 비교하는 가설검증 방법론 : ANOVA k populations = k levels(treatments) H0 : u1 = u2 = u3 H1 : 적어도 2개 factor level이 다르다. F-test로 가설검증 One way ANOVA 점 추정량 (Point Estimator) 변동 (Variation) : 편차의 제곱의 합 (Sum of Squres of Deviation, SS) Sum of Square - 변동성의 척도 SST,SSA,SSE는 카이제곱분포를 따름 검정통계량 F F >1 이면 귀무가설 기각, level간 평균이 같지 않다 : 군간 변동이 군내 변동보다 크다. F < 1이면 귀무가설 채..

통계 2024.04.12

Sampling distribution 표본의 분포 : χ2 분포, t분포, F분포

Sampling distribution(즉, 통계량의 분포)의 대표적인 분포는 정규분포와 카이제곱분포임 표본평균의 분포는 정규분포, 표분분산의 분포는 카이제곱분포를 따름 그외에 t-분포와 F-분포도 따름 카이제곱분포 chi-squared distribution, χ2 분포 정규분포 제곱의 합, v는 자유도를 의미하고 합해준 숫자임. 오차(error) 혹은 편차(deviation)를 분석할 때 도움을 받을 수 있는 분포다. 피어슨 카이제곱 통계량(Pearson’s chi-squared statistics) t-분포 정규분포와 카이제곱분포의 조합 F-분포 카이제곱분포의 비율로 정의

통계 2024.04.12

중심극한정리 Central Limit Theorem

중심극한정리 CLT 모집단의 분포와 상과없이 독립확률변수 X에 대해 X평균의 분포는 정규분포를 따른다. 단,n이 매우 크면. 모집단이 어떤 분포이든지 모집단 평균과 분산을 알면 표본평균의 분포도 알 수 있다. 중심극한정리의 증명 중심극한정리가 중요한 이유 - 모집단에 대한 가정 불필요: 모집단의 분포에 관계없이 표본 평균이 정규 분포를 따른다는 사실을 알 수 있다. - 신뢰 구간 및 가설 검정: 표본 데이터를 사용하여 모집단에 대한 신뢰 구간을 설정하고, 가설 검정을 수행할 수 있다. - 대규모 데이터셋의 분석 용이: 대규모 데이터셋을 다룰 때, 중심 극한 정리는 표본 평균의 분포를 예측하는 데 도움이 된다. 정리하면, 중심극한정리는 표본 평균들이 이루는 표본 분포와 모집단 간의 관계를 증명함으로써, 수..

통계 2024.04.12

통계량 (statistic)

모집단 Population : 관심있는 모든 관측치를 포함 표본 Sample : Population의 subset 표본을 이용하여 모집단의 특성을 파악하는 학문 : 통계학(Statistics) 통계량 (statistic)은 Sample의 함수이다. 대표적인 통계량은 평균과 분산이다. i.i.d. : independent identically distributed, 독립항등분포 --> random variable이 independent(독립적이고) identically distribution(같은 확률분포를)가진다는 뜻임 대표적인 통계량의 분포는 정규분포임.

통계 2024.04.12

적률생성함수 Moment Generating Functions (MGF)

적률함수 Moment functions 적률생성함수 Moment Generating Functions (MGF) 하나의 MGF는 하나의 확률분포와 대응된다. 두개의 확률변수가 같은 MGF를 가지면 같은 분포를 가진다. 확률변수의 MGF를 찾으면 확률분포를 결정할 수 있다. first moment는 한번 미분을 하고 t=0를 대입하여 얻는다. second moment는 두번 미분하고 t=0을 대입하여 얻는다. 예제) Binomial 분포의 MGF 적률생성함수 공식에 대입하면, 예제) Poisson분포의 MGF 적률생성함수 공식에 대입하면, 정리하면, 적률 (moment)는 분포의 특성을 설명해준다. 분포는 확률의 패턴임. - 1th moment :평균 - 2th moment :분산 - 3th moment ..

통계 2024.04.12