| [ KAIST ] in KIDS 글 쓴 이(By): phodue (폿폿폿) 날 짜 (Date): 2001년 7월 26일 목요일 오전 12시 01분 55초 제 목(Title): Re: [질문] 계산용 컴퓨터 http://www.terms.co.kr/PCI-X.htm 에 보니까 현재 PCI의 한계가 532MB/s 이네요. (66Mhz * 64bit 근데 이렇게 하면 528MB/s 가 아닌가요?) Myrinet 장비는 이 한계까지 쓸 수 있다는 거고. 게다가 Latency for short messages 가 7 μs 라네요. 굉장한 것같은데.. 이렇게 되면 궁금해 지는게, Clustering이 어느 정도 효과가 있는건가요? 원래의 제 생각은 Clustering을 해봐야, CPU속도가 아니라 FSB나 RAM, PCI, NIC 등에서 속도를 엄청나게 잡아먹을 것이니까 여러 유명 회사에서 만든 multi processor 시스템에 비해 많이 떨어질 수 밖에 없다고 생각했거든요. 특히 하루, 이틀등 장시간을 사용하는 계산이 아니라 굉장히 짧은 시간에 결과를 내야 하는 경우는 아직 부족할 것같아서요. (아무래도 시스템 보드 상에서 CPU간 데이타전송 속도는 따라갈 수 없을테니까요) 그리고 또 하나 궁금해지는게, 다른 네트웍 장비들(보통 pps-packets per second-로 성능을 따지는 라우터,스위치등)도 이렇게 "Latency for short messages" 같은 걸 따져서 더 좋은 장비라는게 있나요? 하긴 이런건 있어봐야 큰 의미가 없을 것같기는 하네요. 사람은 100ms 차이도 인식을 못할 테니까. ------------------------------------ 1. high speed network에 의한 클러스터링 성능 향상 http://www.alpha11.com/alpha_11/Alpha_11_bench.html 삼성에서 Alpha 21264 667MHz 64대를 연결하여 Linpack 벤치마크를 수행한 결과를 살펴보면, Myrinet에서 51.5GFLOPS, Fast Ethernet에서 31.5GFLOPS의 성능을 얻었습니다. 물론 여기 사용된 Myrinet은 상당히 후진 버젼입니다. 최신 버젼의 Myrinet이 200MHz CPU를 장착하고 2Gbps*양방향 링크 대역폭을 갖는 데 비하여 여기서 사용된 것은 66MHz CPU에 1.28Gbps*양방향 입니다. 성능에 대해 두 가지로 생각하실 수 있습니다. 첫째, 비싼 network 써 봐야 성능이 두 배도 늘지 않는다는 것입니다. 둘째, network 교체 만으로 성능이 무려 20GFLOPS나 증가한다는 것입니다. 물론 사용하는 어플리케이션에 따라 어느 쪽의 입장을 취할지가 달라집니다. 기껏 replicated web server cluster 돌릴거면서 Myrinet 설치하면 돈 아깝죠. 중소규모(N < 100) 클러스터링에서 fast network의 최대 이점은 역시 가격 대비 성능입니다. fast ethernet 등으로는 차마 돌릴 수 없는 커다란 문제들을, 몇 배 비싼 SMP 시스템에 필적하는 성능으로 풀어 주니까요 2. Xorn님의 글에 대한 다른 생각 Xorn 님의 글에서 마지막 두 문단은 조금 모순된 글이 아닌가 생각됩니다. 사람이 ms 단위의 성능 차이를 느끼지 못하는 것처럼, 소규모 계산시에는 network의 성능 차이가 미치는 영향이 그다지 크지 않다고 생각합니다. 물론 이것도 어플리케이션에 따라 다르겠지만, 일반적인 scientific calculation 의 경우입니다. Myrinet으로 5분 걸려 풀 문제를 fast ethernet으로 10분만에 풀건, 혹은 SMP 시스템으로 3분만에 풀건 콘솔 조작자 외에는 별 상관 없을 겁니다. 문제 크기가 커지고 프로세서(노드) 수가 많아지면 얘기가 달라지지요. communication이 바틀넥이 될 것이기 때문에 Myrinet과 같은 high speed network이 fast ethernet에 비해 훨씬 높은 성능을 얻게 됩니다. 아이고, 위에서 쓴 얘기를 또 썼군요. :-) 3. Myrinet의 성능 한계 Myrinet이라고 해서 PCI 64bit 66MHz의 528MHz 대역폭을 모두 활용하고 노드끼리 2Gbps로 통신하는 것은 아닙니다. 어떤 프로토콜을 사용하느냐에 따라 다르겠지만 아무래도 프로토콜 자체의 오버헤드라던가 CPU, Memory, 혹인 다른 노드와의 interraction때문에 성능을 100% 발휘하지 못하죠. fast ethernet의 실제 성능이 100Mbps가 되지 않는 것처럼 말이죠. 음... 다 아시는 얘기를... -_-; Myricom에서 개발한 GM 프로토콜은 최대 245MBps의 성능을 얻는다네요. 이정도면 거의 2Gbps로군요. TCP over Myrinet에서 1Gbps를 넘었다고 자랑하던 때가 엊그제같은데, 네트워크 성능 발전 속도가 놀랍습니다. |