opencl: use q8_0 mm for larger matrix

lhez · lhez · commit 2ea0e0040b95 · 2025-10-09T21:46:25.000-07:00
diff --git a/ggml/src/ggml-opencl/ggml-opencl.cpp b/ggml/src/ggml-opencl/ggml-opencl.cpp
@@ -6975,6 +6975,9 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co
                 return;
             }
             case GGML_TYPE_Q8_0: {
+                if (ne11 < 32) {
+                    break;
+                }
                 kernel = backend_ctx->kernel_mul_mm_q8_0_f32_l4_lm;
                 nth0 = 128; // calculated as (BM*BN)/(TM*TN)
 

Original file line number	Diff line number	Diff line change
`@@ -6975,6 +6975,9 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co`
`6975`	`6975`	`return;`
`6976`	`6976`	`}`
`6977`	`6977`	`case GGML_TYPE_Q8_0: {`
	`6978`	`+ if (ne11 < 32) {`
	`6979`	`+ break;`
	`6980`	`+ }`
`6978`	`6981`	`kernel = backend_ctx->kernel_mul_mm_q8_0_f32_l4_lm;`
`6979`	`6982`	`nth0 = 128; // calculated as (BMBN)/(TMTN)`
`6980`	`6983`