| [ QuizWit ] in KIDS 글 쓴 이(By): pinkrose (Wenger) 날 짜 (Date): 1999년 1월 28일 목요일 오전 09시 04분 10초 제 목(Title): [강의] 통계란 무엇인가?-술에 대하여 sagging하는 조회수를 만회하기위해서 히히... 약간 좀 쉽고 이해하기 쉬운 이야기를 해야만 할것같네요. 흑흑... 오늘은 여러분들이 너무도 익술할만한 술에대한 통계이야기를 해보지요. 흔히들 맥주와 소주등을 같이 먹으면 더 취한다고 합니다. 이게 맞는 이야기일까요 틀린이야기일까요? 물론 생리학적인 분석이 필요하겠지만, 통계적으로 손쉽게 설명이 됩니다. 일반적으로 카페인,마약, 알코올이나 어떤 물질을 섭취할경우 보통 그반응의 강도는 갑짜기 쭈욱 올라갔다가 점진적으로 내려오는 곡선의 형태를 보입니다. 만약 맥주의 마신양을 X라하고 술취한정도를 Y라하면 E(Y) = const. + const*X 라는 모델을 사용합니다. 물론 마신양과 취한 정도가 비선형이라는점이 있지만, log이나, exponential function등을 이용하면 충분히 선형으로 만들수 있습니다. 맥주만 있을경우는 술취한 정도측정하는거 너무 쉽습니다. 만약 맥주와 소주를 동시에 마신다고 가정합시다. 소주의 마신양을 Z이라하면 모델을 좀더 바꾸어야겠지요? 다음과 같이 바꿉니다. E(Y) = const. + const*X + const*Z 그런데 이모델은 좀 엉터리입니다. 그이유는 소주와 맥주와는 서로 상관관계가 없다고 보는모델입니다. 소주나 맥주나 화학물질이고 둘의 반응이 어떻게 될지 모릅니다. 그래서 위의 모델보다는 다음의 모델이 그럴듯합니다. E(Y) = const. + const*X + const*Z + const*XZ 여기서 XZ라는것은 interaction term이라고 통계에서는 부릅니다. 이유는 자명한데 맥주와 소주의 상관관계를 설명합니다. 만약 소주를 한잔하고 맥주를 마시는것이 맥주를 처음부터 마시는것보다 더 취하게 한다면 명백히 모델에는 인터엑션텀이 존재해야합니다. 자 이번엔 맥주,소주,고량주,막걸리,사케,오렌지주스,땅콩,오징어,콜라,우유 등등 엄청나게 이것저것 섭취했다고 가정합시다. 아 물론 '립스틱'도 들어가겠군요. ^^ 이경우 술취한정도를 완벽한 모델링할려면 ( 술을 예로 들었지만, 물리나,화학이나, 생물학이나 이모델링이론은 전부 적용됩니다. interaction terms들에대한 분석을 반드시 해야합니다. 종종 특히 brain functional connectivity같은분야에선 통계에 대한 제대로된 이해가 없어서 저널에 퍼블리쉬되는 논문들의 모델링 자체가 flaw되어 잘못된 결론에 도달하는경우가 가끔있습니다.) 모든 변수들사이의 인터엑션(혹은상관관계) 에 대한 완벽한 이해가 필요하고 충분한 실험이 시행되어야만합니다. 만약 바리에이블이 x1, x2,x3등 3개일경우 E(Y) = const + x1 + x2 + x3 + x1x2 + x2x3 + x3x1 + x1x2x3 으로 정확히 8개의 항이 필요합니다. 물론 이걸보고 keen 한 사람은 모델이 E(Y) = const*f(x1)g(x2)h(x3) 으로 지금까지 위에서 말한 additive model하고 틀리니까 내이야기가 죄다 엉터리가 아니냐고 항의할수도 있겠지만.. any physical,biological or chemical model CAN be transformed to above model. 위의 f(x1)g(x2)h(x3)의 경우는 양변에 로가리듬을 취해주면 명백히 E(Y) = const + x1 + x2 + x3 폼으로 나오지요? 고로 위와같은 멀티플리케이션 모델은 인터엑션이 전혀없는 경우라는걸 알수있습니다. 그래서 이제 여러분은 앞으로 어떤 물리학식이나 수학식이나, 혹은 생물학식을 보고 만약 그공식이 곱셈의 형태로 되어있으면 아하! 로가리듬을 취하면 인터엑션이 없는 형태로 공식이 바뀌겠구나 알것입니다. ^^ 왜 어디티브 룰을 취하냐고요? 제일 다루기 쉽거든요. 예를들면 만유인력의 공식 F= m1m2/r^2 로가리듬 취하면 F = m1 + m2 + r 형식으로 바뀝니다. (여기서 m1 <- log(m1) unit 으로 바뀌었음) 위의것이 쉽습니까 아래것이 쉽습니까? ^^ 참신기한것은 왜 인간의 unit는 로가리듬을 취하지 않았냐는거지요. 물론 물리학에서 로가리듬의 차원을 가지는것이 몇개있습니다. 천체물리학에서 행성의 밝기, 아마 광학에서 쓰이는 대부분의 유니트가로가리듬화되있을것입니다. 사실 물리학의 모든식을 로가리듬으로 바꾼다해도 실제 물리학을 이해하는데 그렇게 큰문제는 없지요. 예를들면 위의 만유인력에서 1/r^2는 수학적으로 공간이 3차원이기때문에 가우스의 divergence theorem 으로 flux를 구할경우 힘이라는건 결국 표면적의 역수에 비례를 하게됩니다. 4차원에서는 그래서 중력이 cm1m2/r^3형태를 취해야합니다. 자그럼 공간이 사차원이라고 가정하고 중력상수를 구할수있습니다. 3차원에서 중력상수를 G라고 가정할경우 4차원에서는 중력상수가 뭘까요? (숙제... ^^ ) 공간이 1차원이면 중력은 재미있는게 F=G(1)m1m2 형태를 취합니다. 공간을 closed 1차원공간으로 만들면 (즉 circle) 중력이 어떻게 나올까요? 그리고 이공간에서 두물체의 equation of motion은 어떻게 될까요? (뉴우턴의 세가지 원리를 만족한다고 가정할경우. 숙제. ^^ ) 술이야기하다가 갑짜기 왜 1차원이야기를 하고있는거지? 쩝...다음부터는 이야기할때 딴데로 안빠지도록 조심해야겠군요. They said "What sign can you give us to see, so that we may believe you?" |