|
@@ -1,3 +1,4 @@
|
|
|
+# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py
|
|
|
# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=btver2 -instruction-tables < %s | FileCheck %s
|
|
|
|
|
|
addpd %xmm0, %xmm2
|
|
@@ -375,6 +376,270 @@ unpcklpd (%rax), %xmm2
|
|
|
xorpd %xmm0, %xmm2
|
|
|
xorpd (%rax), %xmm2
|
|
|
|
|
|
+# CHECK: Instruction Info:
|
|
|
+# CHECK-NEXT: [1]: #uOps
|
|
|
+# CHECK-NEXT: [2]: Latency
|
|
|
+# CHECK-NEXT: [3]: RThroughput
|
|
|
+# CHECK-NEXT: [4]: MayLoad
|
|
|
+# CHECK-NEXT: [5]: MayStore
|
|
|
+# CHECK-NEXT: [6]: HasSideEffects
|
|
|
+
|
|
|
+# CHECK: [1] [2] [3] [4] [5] [6] Instructions:
|
|
|
+# CHECK-NEXT: 1 3 1.00 addpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * addpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 addsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * addsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 addsubpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * addsubpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 andnpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * andnpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 andpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * andpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 cmppd $0, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * cmppd $0, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 cmpsd $0, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * cmpsd $0, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 comisd %xmm0, %xmm1
|
|
|
+# CHECK-NEXT: 1 8 1.00 * comisd (%rax), %xmm1
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtdq2pd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtdq2pd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtdq2ps %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtdq2ps (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtpd2dq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtpd2dq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtpd2ps %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtpd2ps (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtps2dq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtps2dq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvtps2pd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvtps2pd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 2 7 1.00 cvtsd2si %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 2 7 1.00 cvtsd2si %xmm0, %rcx
|
|
|
+# CHECK-NEXT: 2 12 1.00 * cvtsd2si (%rax), %ecx
|
|
|
+# CHECK-NEXT: 2 12 1.00 * cvtsd2si (%rax), %rcx
|
|
|
+# CHECK-NEXT: 2 7 2.00 cvtsd2ss %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 2 12 2.00 * cvtsd2ss (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 2 9 1.00 cvtsi2sdl %ecx, %xmm2
|
|
|
+# CHECK-NEXT: 2 9 1.00 cvtsi2sdq %rcx, %xmm2
|
|
|
+# CHECK-NEXT: 2 14 1.00 * cvtsi2sdl (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 2 14 1.00 * cvtsi2sdl (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 2 7 2.00 cvtss2sd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 2 12 2.00 * cvtss2sd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvttpd2dq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvttpd2dq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 cvttps2dq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * cvttps2dq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 2 7 1.00 cvttsd2si %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 2 7 1.00 cvttsd2si %xmm0, %rcx
|
|
|
+# CHECK-NEXT: 2 12 1.00 * cvttsd2si (%rax), %ecx
|
|
|
+# CHECK-NEXT: 2 12 1.00 * cvttsd2si (%rax), %rcx
|
|
|
+# CHECK-NEXT: 1 19 19.00 divpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 24 19.00 * divpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 19 19.00 divsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 24 19.00 * divsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * * * maskmovdqu %xmm0, %xmm1
|
|
|
+# CHECK-NEXT: 1 2 1.00 maxpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * maxpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 maxsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * maxsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 minpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * minpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 minsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * minsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movapd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movapd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movapd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movd %eax, %xmm2
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movd %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 1 0.50 movdqa %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movdqa %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movdqa (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movdqu %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movdqu %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movdqu (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movhpd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 6 1.00 * movhpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movlpd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 6 1.00 * movlpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 movmskpd %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 1 2 1.00 * movntdq %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 3 1.00 * movntpd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 1 0.50 movq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movq %rax, %xmm2
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movq %xmm0, %rcx
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movq %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 1 0.50 movsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movsd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 movupd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 1.00 * movupd %xmm0, (%rax)
|
|
|
+# CHECK-NEXT: 1 5 1.00 * movupd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 4 2.00 mulpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 9 2.00 * mulpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 4 2.00 mulsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 9 2.00 * mulsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 orpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * orpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pabsb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pabsb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pabsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pabsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pabsw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pabsw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 packssdw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * packssdw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 packsswb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * packsswb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 packuswb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * packuswb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddsb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddsb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddsw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddsw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddusb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddusb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddusw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddusw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 paddw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * paddw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pand %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pand (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pandn %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pandn (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pavgb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pavgb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pavgw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pavgw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpeqb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpeqb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpeqd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpeqd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpeqw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpeqw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpgtb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpgtb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpgtd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpgtd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pcmpgtw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pcmpgtw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 pextrw $1, %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 1 2 1.00 pmaddwd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * pmaddwd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pmaxsw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pmaxsw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pmaxub %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pmaxub (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pminsw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pminsw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pminub %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pminub (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 pmovmskb %xmm0, %ecx
|
|
|
+# CHECK-NEXT: 1 2 1.00 pmulhuw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * pmulhuw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 pmulhw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * pmulhw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 pmullw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * pmullw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 1.00 pmuludq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * pmuludq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 por %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * por (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 2 0.50 psadbw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 7 1.00 * psadbw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pshufd $1, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pshufd $1, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pshufhw $1, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pshufhw $1, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pshuflw $1, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pshuflw $1, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pslld $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pslld %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pslld (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pslldq $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psllq $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psllq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psllq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psllw $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psllw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psllw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrad $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrad %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psrad (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psraw $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psraw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psraw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrld $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrld %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psrld (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrldq $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrlq $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrlq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psrlq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrlw $1, %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psrlw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psrlw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubsb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubsb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubsw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubsw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubusb %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubusb (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubusw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubusw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 psubw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * psubw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpckhbw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpckhbw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpckhdq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpckhdq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpckhqdq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpckhqdq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpckhwd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpckhwd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpcklbw %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpcklbw (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpckldq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpckldq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpcklqdq %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpcklqdq (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 punpcklwd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * punpcklwd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 pxor %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * pxor (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 shufpd $1, %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * shufpd $1, (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 27 27.00 sqrtpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 32 27.00 * sqrtpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 27 27.00 sqrtsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 32 27.00 * sqrtsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 subpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * subpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 subsd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 8 1.00 * subsd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 3 1.00 ucomisd %xmm0, %xmm1
|
|
|
+# CHECK-NEXT: 1 8 1.00 * ucomisd (%rax), %xmm1
|
|
|
+# CHECK-NEXT: 1 1 0.50 unpckhpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * unpckhpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 unpcklpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * unpcklpd (%rax), %xmm2
|
|
|
+# CHECK-NEXT: 1 1 0.50 xorpd %xmm0, %xmm2
|
|
|
+# CHECK-NEXT: 1 6 1.00 * xorpd (%rax), %xmm2
|
|
|
+
|
|
|
# CHECK: Resources:
|
|
|
# CHECK-NEXT: [0] - JALU0
|
|
|
# CHECK-NEXT: [1] - JALU1
|
|
@@ -391,8 +656,11 @@ xorpd (%rax), %xmm2
|
|
|
# CHECK-NEXT: [12] - JVALU1
|
|
|
# CHECK-NEXT: [13] - JVIMUL
|
|
|
|
|
|
+# CHECK: Resource pressure per iteration:
|
|
|
+# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
|
|
|
+# CHECK-NEXT: 17.00 2.00 - 47.50 202.50 115.00 127.00 114.00 - 12.00 43.00 65.50 65.50 10.00
|
|
|
|
|
|
-# CHECK: Resource pressure by instruction:
|
|
|
+# CHECK: Resource pressure by instruction:
|
|
|
# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
|
|
|
# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addpd %xmm0, %xmm2
|
|
|
# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addpd (%rax), %xmm2
|
|
@@ -648,3 +916,4 @@ xorpd (%rax), %xmm2
|
|
|
# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - unpcklpd (%rax), %xmm2
|
|
|
# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - xorpd %xmm0, %xmm2
|
|
|
# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - xorpd (%rax), %xmm2
|
|
|
+
|