anonymous

[알림판목록 I] [알림판목록 II] [글목록][이 전][다 음]
[ anonymous ] in KIDS
글 쓴 이(By): 아무개 (Who Knows ?)
날 짜 (Date): 2007년 9월 27일 목요일 오후 10시 53분 00초
제 목(Title): 근성가이 쿠키?


그래도 절대 자기 잘못은 인정 안할걸..

--

[ guest ] in KIDS
글 쓴 이(By): guest (aaa2) <c-24-131-17-85.h>
날 짜 (Date): 2007년 9월 27일 목요일 오후 06시 24분 32초
제 목(Title): Re: [To Cookie] Re: 하이레벨 컴퓨터 언어

쿠키씨는 대학원과정 아키텍쳐 수업 하나 재미있게 들어보신 수준정도로
파악되는데, 어떻게 저같이 이 분야에서 실제 발담그고 사는 사람에게 교과서
수준의 이론을 펼치시면서 대단한 진리인양 말씀하실 수 있는지 참 그 용기가
대단하군요.

또 애초에 말씀하신 부분들에 오류를 하나하나 지적하면 그 부분에 대한 해명도
없고 뜬금없이 계속 새로운 방향으로 내용을 바꿔 나가니.. -.-;;

애초에 쿠키씨가 "현재 CPU에선 더 이상 FP와  INT latency의 차이는 없다"
라고 말씀하셔서 일단 아키텍쳐적으로 예나 지금이나 그럴 수도 없고, intel
in-out simulator latency까지 말씀해드렸고, 종내는 Intel core에서 3배의
차이가 나온다고 레퍼런스까지 달았는데 그것만으로 님의 대전제가
틀린거잖습니까?

애초에 "두 놈의 latency가 같으니 전부 FP로 대체해도 된다"라면 글을
시작하셔 놓고 이 상황에 당당하게 또 새로운 글을 달고 나올지 몰랐습니다.

2. OoO, Superscalar, ILP, TLP

등등에 관해선 맞는 부분도 있고, 틀린 부분도 있는데 확실한건 교과서수준의
지식으로 말씀하시면 틀린 부분이 나올 수 밖에 없습니다. 실제 CPU들은
교과서에 나온 것 처럼 생기지도, 그렇게 돌아가지도 않거든요. 그 예가
"Speculative wakeup-select"란건데 이건 아키텍춰 박사과정 학생들도 회사에서
일해본 경험이 없으면 잘 모르는 개념입니다. 근데 이게 OoO pipeline과 fu
latency를 이해하는 핵심중 하나거든요. 또 쿠키씨가 제대로 말씀하신 부분,
잘못 알고 계신 부분에 대해서도 ISCA, MICRO 같은 레퍼런스를 해당사항마다
몇개씩 달아드릴 수도 있고, 아키텍춰 시뮬레이터를 돌려서 결과를 보여드릴
수도 있습니다.

당장 Int latency가 3배로 늘어도 performance에 별 영향이 없다..라고 어떻게
당당히 주장하신 부분만해도요.  이제와서 ILP 이야기를 끄집어 내면서 op
latency가 3배로 늘어도 3배로 느려지는건 아니다..라는 이야기를 왜
꺼내십니까? 이제 latency가 느린건 인정하는데 그렇게 느려지진 않는다로
버티기로 입장을 새로 정하셨나요? 님의 "한 30 개의 int op로 된 run 을
생각해 봅시다. 완전 직렬로 수행하면 30 클럭이 걸리지만 실효 int IPC 가
2라고 가정하고 실제로 수행하면 15 클럭에 수행이 끝나게 됩니다.".. 라는
분석도 100% pipeline을 가정하고 dependency도 없다는 가정이 깔려야 어느정도
말이 되는겁니다.

문제는 Int application은 님의 말씀처럼 생기지도 않았고, 몇개의 ciritical
path가 data dependency로 계속 걸려있어서 그 놈의 latency가 모든걸
지배한다는겁니다. 예네가 FP로 바뀌면 끝장이고요. 컴파일러도, 아키텍춰도 이
path를  run-time에서 알아내지 못합니다. Pentium 4의 Int FU가 CPU
클락프리퀀시의 파워 엄청 까먹으면서도 2배 속도로 돈다고 몇번이나
말씀드렸죠? 님 말씀대로라면 애초에 이건 필요없는 짓인데, 실제로 그거
없었으면 P4 하나도 못팔아먹었을겁니다. 그 정도로 op latency가 bottleneck이
되는 경우가 허다해요. 지금 throughput을 위한 하드웨어는 이미 무한대로
존재한다니까요. Multi-core가 바로 그런 형태중 하나입니다. 퍼포먼스가 무슨
특정 FU나 register가 부족해서 안나오는게 아니에요. 당장 Issue queue에
instruction을 충분히 채우는 것도 어렵습니다.

그리고 정말 답답한건...  도대체 애초에 모든 int를 전부 fp로 바꿔도
상관없다고 해놓고 이제와서 왜 이런 이야기는 왜 꺼내시는지 모르겠군요.

상대방이 어느정도의 내공을 가지고 이야기를 하고 있는건지 감이
안오는건가요? -.- 여하튼 쿠키씨의 근성만은 인정해줘야 할 것 같군요.

[알림판목록 I] [알림판목록 II] [글 목록][이 전][다 음]
키 즈 는 열 린 사 람 들 의 모 임 입 니 다.