update batching test

ZuseZ4 · ZuseZ4 · commit 963b3cec91f1 · 2025-03-31T18:27:53.000-04:00
diff --git a/tests/codegen/autodiffv.rs b/tests/codegen/autodiffv.rs
@@ -7,45 +7,82 @@
 use std::autodiff::autodiff;
 
 #[autodiff(d_square3, Forward, Dual, DualOnly)]
-#[no_mangle]
-fn squaref(x: &f32) -> f32 {
-    2.0 * x * x
-}
-
 #[autodiff(d_square2, Forward, 4, Dual, DualOnly)]
-#[autodiff(d_square, Forward, 4, Dual, Dual)]
+#[autodiff(d_square1, Forward, 4, Dual, Dual)]
 #[no_mangle]
 fn square(x: &f32) -> f32 {
     x * x
 }
 
-// CHECK:define internal fastcc void @diffe4square([4 x ptr] %"x'"
-// CHECK-NEXT:invertstart:
-// CHECK-NEXT:  %0 = extractvalue [4 x ptr] %"x'", 0
-// CHECK-NEXT:  %1 = load double, ptr %0, align 8, !alias.scope !15950, !noalias !15953
-// CHECK-NEXT:  %2 = fadd fast double %1, 6.000000e+00
-// CHECK-NEXT:  store double %2, ptr %0, align 8, !alias.scope !15950, !noalias !15953
-// CHECK-NEXT:  %3 = extractvalue [4 x ptr] %"x'", 1
-// CHECK-NEXT:  %4 = load double, ptr %3, align 8, !alias.scope !15958, !noalias !15959
-// CHECK-NEXT:  %5 = fadd fast double %4, 6.000000e+00
-// CHECK-NEXT:  store double %5, ptr %3, align 8, !alias.scope !15958, !noalias !15959
-// CHECK-NEXT:  %6 = extractvalue [4 x ptr] %"x'", 2
-// CHECK-NEXT:  %7 = load double, ptr %6, align 8, !alias.scope !15960, !noalias !15961
-// CHECK-NEXT:  %8 = fadd fast double %7, 6.000000e+00
-// CHECK-NEXT:  store double %8, ptr %6, align 8, !alias.scope !15960, !noalias !15961
-// CHECK-NEXT:  %9 = extractvalue [4 x ptr] %"x'", 3
-// CHECK-NEXT:  %10 = load double, ptr %9, align 8, !alias.scope !15962, !noalias !15963
-// CHECK-NEXT:  %11 = fadd fast double %10, 6.000000e+00
-// CHECK-NEXT:  store double %11, ptr %9, align 8, !alias.scope !15962, !noalias !15963
-// CHECK-NEXT:  ret void
-// CHECK-NEXT:}
+// d_sqaure2
+// CHECK: define internal fastcc [4 x float] @fwddiffe4square(float %x.0.val, [4 x ptr] %"x'")
+// CHECK-NEXT: start:
+// CHECK-NEXT:   %0 = extractvalue [4 x ptr] %"x'", 0
+// CHECK-NEXT:   %"_2'ipl" = load float, ptr %0, align 4, !alias.scope !38, !noalias !39
+// CHECK-NEXT:   %1 = extractvalue [4 x ptr] %"x'", 1
+// CHECK-NEXT:   %"_2'ipl1" = load float, ptr %1, align 4, !alias.scope !40, !noalias !41
+// CHECK-NEXT:   %2 = extractvalue [4 x ptr] %"x'", 2
+// CHECK-NEXT:   %"_2'ipl2" = load float, ptr %2, align 4, !alias.scope !42, !noalias !43
+// CHECK-NEXT:   %3 = extractvalue [4 x ptr] %"x'", 3
+// CHECK-NEXT:   %"_2'ipl3" = load float, ptr %3, align 4, !alias.scope !44, !noalias !45
+// CHECK-NEXT:   %4 = insertelement <4 x float> poison, float %"_2'ipl", i64 0
+// CHECK-NEXT:   %5 = insertelement <4 x float> %4, float %"_2'ipl1", i64 1
+// CHECK-NEXT:   %6 = insertelement <4 x float> %5, float %"_2'ipl2", i64 2
+// CHECK-NEXT:   %7 = insertelement <4 x float> %6, float %"_2'ipl3", i64 3
+// CHECK-NEXT:   %8 = fadd fast <4 x float> %7, %7
+// CHECK-NEXT:   %9 = insertelement <4 x float> poison, float %x.0.val, i64 0
+// CHECK-NEXT:   %10 = shufflevector <4 x float> %9, <4 x float> poison, <4 x i32> zeroinitializer
+// CHECK-NEXT:   %11 = fmul fast <4 x float> %8, %10
+// CHECK-NEXT:   %12 = extractelement <4 x float> %11, i64 0
+// CHECK-NEXT:   %13 = insertvalue [4 x float] undef, float %12, 0
+// CHECK-NEXT:   %14 = extractelement <4 x float> %11, i64 1
+// CHECK-NEXT:   %15 = insertvalue [4 x float] %13, float %14, 1
+// CHECK-NEXT:   %16 = extractelement <4 x float> %11, i64 2
+// CHECK-NEXT:   %17 = insertvalue [4 x float] %15, float %16, 2
+// CHECK-NEXT:   %18 = extractelement <4 x float> %11, i64 3
+// CHECK-NEXT:   %19 = insertvalue [4 x float] %17, float %18, 3
+// CHECK-NEXT:   ret [4 x float] %19
+// CHECK-NEXT: }
+
+// d_square3, the extra float is the original return value (x * x)
+// CHECK: define internal fastcc { float, [4 x float] } @fwddiffe4square.1(float %x.0.val, [4 x ptr] %"x'")
+// CHECK-NEXT: start:
+// CHECK-NEXT:   %0 = extractvalue [4 x ptr] %"x'", 0
+// CHECK-NEXT:   %"_2'ipl" = load float, ptr %0, align 4, !alias.scope !46, !noalias !47
+// CHECK-NEXT:   %1 = extractvalue [4 x ptr] %"x'", 1
+// CHECK-NEXT:   %"_2'ipl1" = load float, ptr %1, align 4, !alias.scope !48, !noalias !49
+// CHECK-NEXT:   %2 = extractvalue [4 x ptr] %"x'", 2
+// CHECK-NEXT:   %"_2'ipl2" = load float, ptr %2, align 4, !alias.scope !50, !noalias !51
+// CHECK-NEXT:   %3 = extractvalue [4 x ptr] %"x'", 3
+// CHECK-NEXT:   %"_2'ipl3" = load float, ptr %3, align 4, !alias.scope !52, !noalias !53
+// CHECK-NEXT:   %_0 = fmul float %x.0.val, %x.0.val
+// CHECK-NEXT:   %4 = insertelement <4 x float> poison, float %"_2'ipl", i64 0
+// CHECK-NEXT:   %5 = insertelement <4 x float> %4, float %"_2'ipl1", i64 1
+// CHECK-NEXT:   %6 = insertelement <4 x float> %5, float %"_2'ipl2", i64 2
+// CHECK-NEXT:   %7 = insertelement <4 x float> %6, float %"_2'ipl3", i64 3
+// CHECK-NEXT:   %8 = fadd fast <4 x float> %7, %7
+// CHECK-NEXT:   %9 = insertelement <4 x float> poison, float %x.0.val, i64 0
+// CHECK-NEXT:   %10 = shufflevector <4 x float> %9, <4 x float> poison, <4 x i32> zeroinitializer
+// CHECK-NEXT:   %11 = fmul fast <4 x float> %8, %10
+// CHECK-NEXT:   %12 = extractelement <4 x float> %11, i64 0
+// CHECK-NEXT:   %13 = insertvalue [4 x float] undef, float %12, 0
+// CHECK-NEXT:   %14 = extractelement <4 x float> %11, i64 1
+// CHECK-NEXT:   %15 = insertvalue [4 x float] %13, float %14, 1
+// CHECK-NEXT:   %16 = extractelement <4 x float> %11, i64 2
+// CHECK-NEXT:   %17 = insertvalue [4 x float] %15, float %16, 2
+// CHECK-NEXT:   %18 = extractelement <4 x float> %11, i64 3
+// CHECK-NEXT:   %19 = insertvalue [4 x float] %17, float %18, 3
+// CHECK-NEXT:   %20 = insertvalue { float, [4 x float] } undef, float %_0, 0
+// CHECK-NEXT:   %21 = insertvalue { float, [4 x float] } %20, [4 x float] %19, 1
+// CHECK-NEXT:   ret { float, [4 x float] } %21
+// CHECK-NEXT: }
 
 fn main() {
     let x = std::hint::black_box(3.0);
     let output = square(&x);
     dbg!(&output);
     assert_eq!(9.0, output);
-    dbg!(squaref(&x));
+    dbg!(square(&x));
 
     let mut df_dx1 = 1.0;
     let mut df_dx2 = 2.0;
@@ -54,7 +91,7 @@ fn main() {
     let [o1, o2, o3, o4] = d_square2(&x, &mut df_dx1, &mut df_dx2, &mut df_dx3, &mut df_dx4);
     dbg!(o1, o2, o3, o4);
     let [output2, o1, o2, o3, o4] =
-        d_square(&x, &mut df_dx1, &mut df_dx2, &mut df_dx3, &mut df_dx4);
+        d_square1(&x, &mut df_dx1, &mut df_dx2, &mut df_dx3, &mut df_dx4);
     dbg!(o1, o2, o3, o4);
     assert_eq!(output, output2);
     assert!((6.0 - o1).abs() < 1e-10);