| [ CnUnix ] in KIDS 글 쓴 이(By): zzapuno (정내훈) 날 짜 (Date): 2003년 4월 25일 금요일 오후 01시 16분 10초 제 목(Title): Re: 계산 코드 옵티마이즈.. intel gcc에서 O3 옵티마이즈 옵션을 붙혀서 컴파일 했습니다. 그래도 결과는 같았습니다. 명령어의 차이는... fmul %st(0),%st 과 imull %eax,%eax 이런차이가 있었습니다. 인텔은 어쩔 수 없나봅니다... 글을쓰다 날아가서 다시 쓰는바람에 어셈덤프한걸 보여드리진 못하겠네요.ㅜ.ㅠ 어떻게해도 스팍칩에선 double이 빠르네요.. 스팍도 어셈뿌려봤는데 리스크 어셈블리는 역시 암호해독수준이라.... ps. 불가능한 일이겠지만 ARRAY 곱셈기를 만들면 1clock에도 계산을 끝낼순 있겠죠.. ㅎㅎ ================================================================== fmul %st(0),%st라면 더이상 옵티마이즈할 여지가 없네요.^^ P3에서는 imul명령어도 하드웨어를 더 써서 빠르게 했다라는 이야기를 들었었는데 (P2이던가...) 정말이었군요. Pentium에서는 확실히 imul이 더 느렸었습니다. RISC칩은 integer multiply명령어 자체가 없는 경우가 많습니다. MIPS, SPARC 등등. integer multiply명령어 자체가 RISC의 철학에 어긋나죠. |