#include "SCRFDFaceDetector.h" #include "ANSGpuFrameRegistry.h" #include "NV12PreprocessHelper.h" // tl_currentGpuFrame() #include "Utility.h" #include //#define FNS_DEBUG namespace ANSCENTER { // Initialization function with memory leak handling bool ANSSCRFDFD::Initialize(std::string licenseKey, ModelConfig modelConfig, const std::string& modelZipFilePath, const std::string& modelZipPassword, std::string& labelMap) { // Clean up existing resources before reinitialization const bool engineAlreadyLoaded = _isInitialized && m_trtEngine != nullptr; if (!engineAlreadyLoaded) Destroy(); // Call base class Initialize bool result = ANSFDBase::Initialize(licenseKey, modelConfig, modelZipFilePath, modelZipPassword, labelMap); if (!result) return false; labelMap = "Face"; _licenseValid = true; try { _modelConfig = modelConfig; _modelConfig.inpHeight = 640; _modelConfig.inpWidth = 640; _modelConfig.modelType = ModelType::FACEDETECT; _modelConfig.detectionType = DetectionType::FACEDETECTOR; std::string onnxfile = CreateFilePath(_modelFolder, "scrfdface.onnx"); if (!std::filesystem::exists(onnxfile)) { this->_logger.LogError("ANSSCRFDFD::Initialize. Model scrfdface.onnx file does not exist", onnxfile, __FILE__, __LINE__); return false; } _modelFilePath = onnxfile; // Initialize TensorRT via shared pool if (!m_trtEngine) { m_options.precision = ANSCENTER::Precision::FP16; m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.calibrationBatchSize = 1; m_poolKey = { _modelFilePath, static_cast(m_options.precision), m_options.maxBatchSize }; m_trtEngine = EnginePoolManager::instance().acquire( m_poolKey, m_options, _modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE, m_maxSlotsPerGpu); m_usingSharedPool = (m_trtEngine != nullptr); if (!m_trtEngine) { this->_logger.LogError("ANSSCRFDFD::Initialize. Unable to build or load TensorRT engine.", _modelFilePath, __FILE__, __LINE__); return false; } } fmc = 3; feat_stride_fpn = { 8, 16, 32 }; num_anchors = 2; use_kps = true; _movementObjects.clear(); _retainDetectedFaces = 0; _isInitialized = true; return true; } catch (const std::exception& e) { this->_logger.LogFatal("ANSSCRFDFD::Initialize", e.what(), __FILE__, __LINE__); return false; } } bool ANSSCRFDFD::LoadModel(const std::string& modelZipFilePath, const std::string& modelZipPassword) { try { // We need to get the _modelFolder bool result = ANSFDBase::LoadModel(modelZipFilePath, modelZipPassword); if (!result) return false; const bool engineAlreadyLoaded = _isInitialized && m_trtEngine != nullptr; _modelConfig.modelType = ModelType::FACEDETECT; _modelConfig.detectionType = DetectionType::FACEDETECTOR; _modelConfig.inpHeight = 640; _modelConfig.inpWidth = 640; _movementObjects.clear(); _retainDetectedFaces = 0; std::string onnxfile = CreateFilePath(_modelFolder, "scrfdface.onnx"); if (!std::filesystem::exists(onnxfile)) { this->_logger.LogError("ANSSCRFDFD::Initialize. Model scrfdface.onnx file does not exist", onnxfile, __FILE__, __LINE__); return false; } _modelFilePath = onnxfile; if (!m_trtEngine) { m_options.precision = ANSCENTER::Precision::FP16; m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_poolKey = { _modelFilePath, static_cast(m_options.precision), m_options.maxBatchSize }; m_trtEngine = EnginePoolManager::instance().acquire( m_poolKey, m_options, _modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE, m_maxSlotsPerGpu); m_usingSharedPool = (m_trtEngine != nullptr); if (!m_trtEngine) { this->_logger.LogError("ANSSCRFDFD::LoadModel. Unable to build or load TensorRT engine.", _modelFilePath, __FILE__, __LINE__); return false; } } fmc = 3; feat_stride_fpn = { 8, 16, 32 }; num_anchors = 2; use_kps = true; _movementObjects.clear(); _retainDetectedFaces = 0; _isInitialized = true; return true; } catch (std::exception& e) { this->_logger.LogFatal("ANSSCRFDFD::LoadModel", e.what(), __FILE__, __LINE__); return false; } } bool ANSSCRFDFD::LoadModelFromFolder(std::string licenseKey, ModelConfig modelConfig, std::string modelName, std::string className, const std::string& modelFolder, std::string& labelMap) { try { // We need to get the _modelFolder bool result = ANSFDBase::LoadModelFromFolder(licenseKey, modelConfig, modelName, className, modelFolder, labelMap); if (!result) return false; std::string _modelName = modelName; if (_modelName.empty()) { _modelName = "scrfdface"; } _modelConfig.inpHeight = 640; _modelConfig.inpWidth = 640; _movementObjects.clear(); _retainDetectedFaces = 0; std::string modelFullName = _modelName + ".onnx"; std::string onnxfile = CreateFilePath(_modelFolder, modelFullName); if (std::filesystem::exists(onnxfile)) { _modelFilePath = onnxfile; this->_logger.LogDebug("ANSSCRFDFD::LoadModel. Loading scrfdface weight", _modelFilePath, __FILE__, __LINE__); } else { this->_logger.LogError("ANSSCRFDFD::LoadModel. Model scrfdface.onnx file is not exist", _modelFilePath, __FILE__, __LINE__); return false; } return true; } catch (std::exception& e) { this->_logger.LogFatal("ANSSCRFDFD::LoadModel", e.what(), __FILE__, __LINE__); return false; } } bool ANSSCRFDFD::OptimizeModel(bool fp16, std::string& optimizedModelFolder) { std::lock_guard lock(_mutex); if (!FileExist(_modelFilePath)) { optimizedModelFolder = ""; return false; } optimizedModelFolder = GetParentFolder(_modelFilePath); // Check if the engine already exists to avoid reinitializing if (!m_trtEngine) { // Fixed batch size of 1 for this model m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.engineFileDir = optimizedModelFolder; // Use FP16 or FP32 precision based on the input flag m_options.precision = Precision::FP16; // Create the TensorRT inference engine m_trtEngine = std::make_shared>(m_options); } // Build the TensorRT engine auto succ = m_trtEngine->buildWithRetry(_modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE); if (!succ) { const std::string errMsg = "Error: Unable to build the TensorRT engine. " "Try increasing TensorRT log severity to kVERBOSE."; this->_logger.LogError("ANSSCRFDFD::OptimizeModel", errMsg, __FILE__, __LINE__); return false; } std::string optimizedFaceAttributeModelFolder; bool result = ANSFDBase::OptimizeModel(fp16, optimizedFaceAttributeModelFolder); return result; } std::vector