feat(ml): ARMNN acceleration (#5667)

* feat(ml): ARMNN acceleration for CLIP * wrap ANN as ONNX-Session * strict typing * normalize ARMNN CLIP embedding * mutex to handle concurrent execution * make inputs contiguous * fine-grained locking; concurrent network execution --------- Co-authored-by: mertalev <101130780+mertalev@users.noreply.github.com>
2025-08-12 22:29:35 +02:00 · 2024-01-11 18:26:46 +01:00 · 2024-01-11 18:26:46 +01:00 · 753292956e
commit 753292956e
parent 29747437f6
17 changed files with 956 additions and 44 deletions
--- a/machine-learning/app/models/facial_recognition.py
+++ b/machine-learning/app/models/facial_recognition.py
@ -3,7 +3,6 @@ from typing import Any

 import cv2
 import numpy as np
-import onnxruntime as ort
 from insightface.model_zoo import ArcFaceONNX, RetinaFace
 from insightface.utils.face_align import norm_crop

@ -27,23 +26,8 @@ class FaceRecognizer(InferenceModel):
        super().__init__(clean_name(model_name), cache_dir, **model_kwargs)

    def _load(self) -> None:
-        self.det_model = RetinaFace(
-            session=ort.InferenceSession(
-                self.det_file.as_posix(),
-                sess_options=self.sess_options,
-                providers=self.providers,
-                provider_options=self.provider_options,
-            ),
-        )
-        self.rec_model = ArcFaceONNX(
-            self.rec_file.as_posix(),
-            session=ort.InferenceSession(
-                self.rec_file.as_posix(),
-                sess_options=self.sess_options,
-                providers=self.providers,
-                provider_options=self.provider_options,
-            ),
-        )
+        self.det_model = RetinaFace(session=self._make_session(self.det_file))
+        self.rec_model = ArcFaceONNX(self.rec_file.as_posix(), session=self._make_session(self.rec_file))

        self.det_model.prepare(
            ctx_id=0,