Kids BBS

[알림판목록 I] [알림판목록 II] [글목록][이 전][다 음]

[ QuizWit ] in KIDS
글 쓴 이(By): pinkrose (개구리왕자)
날 짜 (Date): 1999년 2월 24일 수요일 오후 02시 45분 39초
제 목(Title): [강의] 통계란 무엇인가 ? 11

맘에 안차서 새롭게 에디트했습니다. ^^

---------------------------------------------

What is Random?

가끔  컴퓨터 언어에 보면, random number generator라는게 있는데,

컴퓨터 알고리듬으로 만들어지는 모든 렌덤넘버는 결코 random한것이

아니다. 이미 알고리듬이 있다는자체가 숫자가 렌덤이 아님을 증명한다.

컴퓨터 알고리듬에서 만들어지는 렌덤숫자는 보통  stochastically random

이라 한다. 즉 통계적인 렌덤이라는 의미이다. 통계에서는 렌덤을 정의할때,

random variable이란 수학적 object로 정의한다. 동전던지기에서 앞면과 뒷면이

나오는경우를 상상하자. H(head), T(tail) 로 보통 표시가 되는데,

HTTHHHTTHTH... 이런식으로 나온다면, 이 sequence는 엄밀한의미에서의

렌덤일리가 없다. 왜냐면, 비록 어떤 경우가 나올지는 모르지만, 동전을

무한히 던질경우 반드시  1/2만큼은 머리가 1/2만큼은 꼬리가 나와야한다는

법칙을 따라야 하기때문이다. n-번째 던질때 나오는 경우를  X(n)이라는 함수로

표시를 할경우 위의경우는   X(1) = H, X(2)= T, X(3)= T ...

으로나오고 이러한 경우를 표시하는 함수를 렌덤바리에이블이라 정의한다.

그래서  random variable은 엄밀한의미에서 바리에이블이 아니라, 함수이다.

아쉽게도 이런 용어는 메져이론이 나오기전에 정의된거라 이러한 혼돈된 명칭으로

불리는것이다. 만약   f를 일반적 수학적 함수라 하면   f(X(n)) 역시

렌덤바리에이블이다.  만약 동전이 삐뚤어져있어 앞면이 나올확률과 뒷면이

나올확률이 다를경우 즉 앞면이 나올경우를 p, 뒷면일경우를 1-p 라하면,

P( X(n) = H) = p, P(X(n) = T) = 1-p 로정의된다.

이걸 우리는 흔히 베르누이 분포(Bernoulli Distribution)이라 칭한다.

그리고  p는   parameter of the distribution이라한다.

통계분포가 어떠한 파라메터의 함수로 표현이될경우는

parametric distribution이라한다.

그렇다면  어떠한 파라메터의 함수로도 표현되지

않는 분포가 있을까? 있다. nonparametic distribution이라해서, 동전던지기에서

앞면이 나올 확률이  p인동전을  Coin(p) 라하면 매번 던질때마다 똑같은동전으로

던지는게 아니라 다른 Coin(p)로던지면 된다. 이경우 X(n)은 여전히

렌덤바리에이블이다.

통계에 있어,  nonparametic Theory라는 분야가 있는데, 이렇게  파라메터로

표현이 되지 않는 통계적인입장에서도 무척 무질서한 분포에 대한 연구를 한다.

이 이론중에 sequence of H's and T's 의 분포에 대한 테스트가 있다.

예를들면  Run Test라는게 있는데, 만약   HHTHHTHHTHHT... 이런경우가 주어질경우

이수열에 규칙성이 존재하는지 않하는지 통계적으로  test할수있다. 만약 이테스트로

이수열에 규칙성이 존재하지않을경우, 이수열이 베르누이 분포를

보이는지 아닌지도 테스트할도있다.

만약 parmeter p, 동전의 앞면이 나올확률이 고정된게 아니라, 동전을 던질때마다

바뀐다고 가정을 하자. 만약  p = Y(n)라는 렌덤바리에이블을 가진다고 하자.

p 는당연히  확률이니까,  0 <= p <= 1 이어야한다. 그렇다면,

X(n) = 1 with probability p,
       0 with probability 1-p 라는 베르누이분포가 주어져있는데,

또여기 p = Y(n)이란 렌덤바리에이블로 주어진다.

이러한 복잡한 모델을 hirachial model(하이라키알 모델) 이라주어진다.

이경우는 이층구조인데, 삼층 사층까지 갈수있다. 재미있는것은, 이러한 하이라키알

모델에서는 다음의 공식이 통용된다.

E(EX(n)) = E(p) = EY(n)

하이라키알모델이라는건 통계열역학에는 깁스 프로세스(Gibbs Process)

혹은 깁스 쌤플링으로 불려지는, 조건부 확률( conditional probability)에관한

또다른 표현방식임을 알수있다. 조건부 확률이란건 또 해석학(analysis)에서는

라돈니코딤미분(radon-nikodym derivative) 의 또다른 표현방식임을 알아야한다.

결국 해석학, 통계, 물리학에서 제각기 다른방식으로 불리는 세가지 개념이

궁극적으로는 하나라는 소리이다. 간단하게 주사위를 가지고 이 깁스 프로세스가

무언지 설명하자. 홀수 {1,3,5} 가 나올확률은 1/2 이고 짝수가 나올확률은 1/2
이다.

그리고 {1} 이나올 확률은 1/6이다. 그렇다면 주사위를 던져 홀수가 나온상태에서

1 이 나올확률은 (1/6) / (1/2) = 1/3 으로 주어진다. 주어진 확률분포에서 새롭게

확률분포를 생성해내는 방법이 바로 조건부 확률이다.

    They said "What sign can you give us to see, so that we may believe you?"

[알림판목록 I] [알림판목록 II] [글 목록][이 전][다 음]

키 즈 는 열 린 사 람 들 의 모 임 입 니 다.