| [ QuizWit ] in KIDS 글 쓴 이(By): ilusion (luVthYsouL맧) 날 짜 (Date): 1997년10월30일(목) 17시13분46초 ROK 제 목(Title): re: 발리씨 멀티 리그레션 문제. 위의 오래된문제들을 보다가 ... 이제 발리씨의 질문에 답해줄수 있는 실력이 된것같군요. 크크..몇달 걸렸네요. 저희 학교 스타인교수한테 배운거니까 그분한테 감사를... 멀티 리그레션을 할려면 Y= AX 라는식으로 메이트릭스 폼으로 만드는게 제일 쉽습니다. 이유는 에스티메이터를 구하는데 있어서 각각의 바리에이블들을 따로 따로 생각지 않고 메이트릭스라는 큰 바리에이블로 생각하기에 계산이 좀 덜복잡한이유도 있고.. 싸쓰나 메뜨랩같은 소프트웨어 페케지 쓸때 무척 쉽게 숫자만 넣어주면 됩니다. estimater 라는건 쉽게 뭐냐면 와이를 계산하고 싶은데 에이 메이트릭스가 주는값들이 inconsistant 하게 되거든요. 결국 수학적으로 답이 없는데 이걸 통계적으로 추측해서 통밥때릴려는 거에서 오는 것입니다. 예를 들면 학생들 점수를 계산할때 클레스 에버러지를 알경우 이 어버러지를 그클레스의 어떤학생의 점수라고 추측해도 그렇게 통계적으로 틀린 답이 아니거든요. 멀티 리그레션에서 모델이 어떤거냐에 따라 달라집니다. 보통 에스티메이터를 LSE 라고 해서 리스ㅌ트 스퀘어 에스티메이터로 줍니다. 이거야 메트릭을 뭘로 주냐에 따라 다른거죠. 스퀘어를 최소하하는 메트릭이 있을수 있고 그냥 절대값을 최소화시켜도 되고 이거야 어떠한 모델을 원하느냐에 따라 달린거니까. 근데 샘플이 너무 많고 바리에이블도 너무 많을때는 그냥 단순한 리니어 리그레션으로 하기보담은 리그레션 중간중간을 끊어서 각 인터발마다 리니어로 어프록시메이션 해주는게 더 정확해집니다. 이럴경우 나오는 그래프는 각 인터발마다는 직선인데 각이진 함수로. 에스티 메이터를 구하는방법은 일반 리그래션책을 보면 됩니다. 그렇게 구해진 에스티메이터가 바로 위의 메트릭스 공식을 그래도 덜!!!!! inconsistant 하게 만드는것입니다. 거기다 그냥 엑스 컬럼 벡터값 취해서 넣어주면 답이 나옵니다. 인콘시스턴스의 예를 들면 쉬운데 a + b = 0 a + b = 1 위의 시스템오브 식들은 답이 없죠. 수학적으로는 에이가 뭔지 비가 뭔지 의미가 없지만 통계적으로 가장 위의 식을 어떻게하면 맞출수있을까 고민한끝에 에러의 제곱의 합을 최소하 하는 방법으로 에이하고 비를 선택할경우 좀 그럴듯하지 않을까 해서 에이하고 비를 그런식으로 에스티 메이ㅌ트하게 됩니다. 그러면 위의 데이터셋으로부터 2a + 4b 가 먼지 통계적으로 예측할수있죠. iLUSiON chung@math.mcgill.ca chung@math.toronto.edu |