#include "ANSRTYOLO.h" #include "Utility.h" #include "ANSLicense.h" // ANS_DBG macro for DebugView #include #include #include #include #include #include #include namespace ANSCENTER { // ==================================================================== // ANSODBase interface — OptimizeModel // ==================================================================== bool ANSRTYOLO::OptimizeModel(bool fp16, std::string& optimizedModelFolder) { std::lock_guard lock(_mutex); if (!ANSODBase::OptimizeModel(fp16, optimizedModelFolder)) return false; if (!FileExist(_modelFilePath)) { _logger.LogFatal("ANSRTYOLO::OptimizeModel", "Raw model file path does not exist", __FILE__, __LINE__); return false; } try { _fp16 = fp16; optimizedModelFolder = GetParentFolder(_modelFilePath); if (!m_trtEngine) { m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.engineFileDir = optimizedModelFolder; m_options.precision = (_fp16 ? Precision::FP16 : Precision::FP32); m_trtEngine = std::make_shared>(m_options); } auto succ = m_trtEngine->buildWithRetry(_modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE); if (!succ) { _logger.LogError("ANSRTYOLO::OptimizeModel", "Error: Unable to build TensorRT engine. " + _modelFilePath, __FILE__, __LINE__); return false; } return true; } catch (std::exception& e) { _logger.LogFatal("ANSRTYOLO::OptimizeModel", e.what(), __FILE__, __LINE__); return false; } } // ==================================================================== // ANSODBase interface — LoadModel // ==================================================================== bool ANSRTYOLO::LoadModel(const std::string& modelZipFilePath, const std::string& modelZipPassword) { std::lock_guard lock(_mutex); try { _isFixedBatch = false; bool result = ANSODBase::LoadModel(modelZipFilePath, modelZipPassword); if (!result) return false; _modelConfig.modelType = ModelType::TENSORRT; if (_modelConfig.inpHeight <= 0) _modelConfig.inpHeight = 640; if (_modelConfig.inpWidth <= 0) _modelConfig.inpWidth = 640; if (_modelConfig.modelMNSThreshold < 0.2f) _modelConfig.modelMNSThreshold = 0.5f; if (_modelConfig.modelConfThreshold < 0.2f) _modelConfig.modelConfThreshold = 0.5f; if (_modelConfig.numKPS <= 0 || _modelConfig.numKPS > 133) _modelConfig.numKPS = 17; if (_modelConfig.kpsThreshold <= 0) _modelConfig.kpsThreshold = 0.5f; _fp16 = true; TOP_K = 300; SEG_CHANNELS = 32; PROBABILITY_THRESHOLD = _modelConfig.detectionScoreThreshold; NMS_THRESHOLD = _modelConfig.modelMNSThreshold; SEGMENTATION_THRESHOLD = 0.5f; SEG_H = 160; SEG_W = 160; NUM_KPS = _modelConfig.numKPS; KPS_THRESHOLD = _modelConfig.kpsThreshold; m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.engineFileDir = _modelFolder; m_options.precision = (_fp16 ? Precision::FP16 : Precision::FP32); _modelFilePath = CreateFilePath(_modelFolder, "train_last.onnx"); if (FileExist(_modelConfigFile)) { ModelType modelType; std::vector inputShape; _classes = ANSUtilityHelper::GetConfigFileContent(_modelConfigFile, modelType, inputShape); if (inputShape.size() == 2) { if (inputShape[0] > 0) _modelConfig.inpHeight = inputShape[0]; if (inputShape[1] > 0) _modelConfig.inpWidth = inputShape[1]; } } else { _classFilePath = CreateFilePath(_modelFolder, "classes.names"); std::ifstream isValid(_classFilePath); if (!isValid) LoadClassesFromString(); else LoadClassesFromFile(); } if (this->_loadEngineOnCreation) { if (!m_trtEngine) { m_poolKey = { _modelFilePath, static_cast(m_options.precision), m_options.maxBatchSize }; m_trtEngine = EnginePoolManager::instance().acquire( m_poolKey, m_options, _modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE, m_maxSlotsPerGpu); m_usingSharedPool = (m_trtEngine != nullptr); } if (!m_trtEngine) { _logger.LogError("ANSRTYOLO::LoadModel", "Error: Unable to load TensorRT engine. " + _modelFilePath, __FILE__, __LINE__); _modelLoadValid = false; return false; } m_options.maxBatchSize = m_trtEngine->getOptions().maxBatchSize; m_options.optBatchSize = m_trtEngine->getOptions().optBatchSize; m_trtEngine->warmUp(); } _modelLoadValid = true; _isInitialized = true; return true; } catch (std::exception& e) { _logger.LogFatal("ANSRTYOLO::LoadModel", e.what(), __FILE__, __LINE__); return false; } } // ==================================================================== // ANSODBase interface — LoadModelFromFolder // ==================================================================== bool ANSRTYOLO::LoadModelFromFolder(std::string licenseKey, ModelConfig modelConfig, std::string modelName, std::string className, const std::string& modelFolder, std::string& labelMap) { std::lock_guard lock(_mutex); try { _isFixedBatch = false; bool result = ANSODBase::LoadModelFromFolder(licenseKey, modelConfig, modelName, className, modelFolder, labelMap); if (!result) return false; _modelConfig = modelConfig; _modelConfig.modelType = ModelType::TENSORRT; if (_modelConfig.inpHeight <= 0) _modelConfig.inpHeight = 640; if (_modelConfig.inpWidth <= 0) _modelConfig.inpWidth = 640; _modelConfig.precisionType = PrecisionType::FP32; if (_modelConfig.numKPS <= 0 || _modelConfig.numKPS > 133) _modelConfig.numKPS = 17; if (_modelConfig.modelMNSThreshold < 0.2f) _modelConfig.modelMNSThreshold = 0.5f; if (_modelConfig.modelConfThreshold < 0.2f) _modelConfig.modelConfThreshold = 0.5f; if (_modelConfig.kpsThreshold <= 0) _modelConfig.kpsThreshold = 0.5f; _fp16 = true; TOP_K = 300; SEG_CHANNELS = 32; PROBABILITY_THRESHOLD = _modelConfig.detectionScoreThreshold; NMS_THRESHOLD = _modelConfig.modelMNSThreshold; SEGMENTATION_THRESHOLD = 0.5f; SEG_H = 160; SEG_W = 160; NUM_KPS = _modelConfig.numKPS; KPS_THRESHOLD = _modelConfig.kpsThreshold; std::string _modelName = modelName; if (_modelName.empty()) _modelName = "train_last"; std::string modelFullName = _modelName + ".onnx"; m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.engineFileDir = _modelFolder; m_options.precision = (_fp16 ? Precision::FP16 : Precision::FP32); _modelFilePath = CreateFilePath(_modelFolder, modelFullName); if (FileExist(_modelConfigFile)) { ModelType modelType; std::vector inputShape; _classes = ANSUtilityHelper::GetConfigFileContent(_modelConfigFile, modelType, inputShape); if (inputShape.size() == 2) { if (inputShape[0] > 0) _modelConfig.inpHeight = inputShape[0]; if (inputShape[1] > 0) _modelConfig.inpWidth = inputShape[1]; } } else { _classFilePath = CreateFilePath(_modelFolder, className); std::ifstream isValid(_classFilePath); if (!isValid) LoadClassesFromString(); else LoadClassesFromFile(); } labelMap.clear(); if (!_classes.empty()) labelMap = VectorToCommaSeparatedString(_classes); if (this->_loadEngineOnCreation) { if (!m_trtEngine) { m_poolKey = { _modelFilePath, static_cast(m_options.precision), m_options.maxBatchSize }; m_trtEngine = EnginePoolManager::instance().acquire( m_poolKey, m_options, _modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE, m_maxSlotsPerGpu); m_usingSharedPool = (m_trtEngine != nullptr); } if (!m_trtEngine) { _logger.LogError("ANSRTYOLO::LoadModelFromFolder", "Error: Unable to load TensorRT engine. " + _modelFilePath, __FILE__, __LINE__); _modelLoadValid = false; return false; } m_options.maxBatchSize = m_trtEngine->getOptions().maxBatchSize; m_options.optBatchSize = m_trtEngine->getOptions().optBatchSize; m_trtEngine->warmUp(); } _modelLoadValid = true; _isInitialized = true; return true; } catch (std::exception& e) { _logger.LogFatal("ANSRTYOLO::LoadModelFromFolder", e.what(), __FILE__, __LINE__); return false; } } // ==================================================================== // ANSODBase interface — Initialize // ==================================================================== bool ANSRTYOLO::Initialize(std::string licenseKey, ModelConfig modelConfig, const std::string& modelZipFilePath, const std::string& modelZipPassword, std::string& labelMap) { std::lock_guard lock(_mutex); try { const bool engineAlreadyLoaded = _modelLoadValid && _isInitialized && m_trtEngine != nullptr; _modelLoadValid = false; _isFixedBatch = false; bool result = ANSODBase::Initialize(licenseKey, modelConfig, modelZipFilePath, modelZipPassword, labelMap); if (!result) return false; _modelConfig = modelConfig; _modelConfig.modelType = ModelType::TENSORRT; if (_modelConfig.inpHeight <= 0) _modelConfig.inpHeight = 640; if (_modelConfig.inpWidth <= 0) _modelConfig.inpWidth = 640; _modelConfig.precisionType = PrecisionType::FP32; if (_modelConfig.numKPS <= 0 || _modelConfig.numKPS > 133) _modelConfig.numKPS = 17; if (_modelConfig.modelMNSThreshold < 0.2f) _modelConfig.modelMNSThreshold = 0.5f; if (_modelConfig.modelConfThreshold < 0.2f) _modelConfig.modelConfThreshold = 0.5f; if (_modelConfig.kpsThreshold <= 0) _modelConfig.kpsThreshold = 0.5f; _fp16 = true; TOP_K = 300; SEG_CHANNELS = 32; PROBABILITY_THRESHOLD = _modelConfig.detectionScoreThreshold; NMS_THRESHOLD = _modelConfig.modelMNSThreshold; SEGMENTATION_THRESHOLD = 0.5f; SEG_H = 160; SEG_W = 160; NUM_KPS = _modelConfig.numKPS; KPS_THRESHOLD = _modelConfig.kpsThreshold; m_options.optBatchSize = _modelConfig.gpuOptBatchSize; m_options.maxBatchSize = _modelConfig.gpuMaxBatchSize; m_options.deviceIndex = _modelConfig.gpuDeviceIndex; m_options.maxInputHeight = _modelConfig.maxInputHeight; m_options.minInputHeight = _modelConfig.minInputHeight; m_options.optInputHeight = _modelConfig.optInputHeight; m_options.maxInputWidth = _modelConfig.maxInputWidth; m_options.minInputWidth = _modelConfig.minInputWidth; m_options.optInputWidth = _modelConfig.optInputWidth; m_options.engineFileDir = _modelFolder; m_options.precision = (_fp16 ? Precision::FP16 : Precision::FP32); _modelFilePath = CreateFilePath(_modelFolder, "train_last.onnx"); if (FileExist(_modelConfigFile)) { ModelType modelType; std::vector inputShape; _classes = ANSUtilityHelper::GetConfigFileContent(_modelConfigFile, modelType, inputShape); if (inputShape.size() == 2) { if (inputShape[0] > 0) _modelConfig.inpHeight = inputShape[0]; if (inputShape[1] > 0) _modelConfig.inpWidth = inputShape[1]; } } else { _classFilePath = CreateFilePath(_modelFolder, "classes.names"); std::ifstream isValid(_classFilePath); if (!isValid) LoadClassesFromString(); else LoadClassesFromFile(); } labelMap.clear(); if (!_classes.empty()) labelMap = VectorToCommaSeparatedString(_classes); if (this->_loadEngineOnCreation && !engineAlreadyLoaded) { if (!m_trtEngine) { m_poolKey = { _modelFilePath, static_cast(m_options.precision), m_options.maxBatchSize }; m_trtEngine = EnginePoolManager::instance().acquire( m_poolKey, m_options, _modelFilePath, SUB_VALS, DIV_VALS, NORMALIZE, m_maxSlotsPerGpu); m_usingSharedPool = (m_trtEngine != nullptr); } if (!m_trtEngine) { _logger.LogError("ANSRTYOLO::Initialize", "Error: Unable to load TensorRT engine. " + _modelFilePath, __FILE__, __LINE__); _modelLoadValid = false; return false; } m_options.maxBatchSize = m_trtEngine->getOptions().maxBatchSize; m_options.optBatchSize = m_trtEngine->getOptions().optBatchSize; m_trtEngine->warmUp(); } _modelLoadValid = true; _isInitialized = true; return true; } catch (std::exception& e) { _logger.LogFatal("ANSRTYOLO::Initialize", e.what(), __FILE__, __LINE__); return false; } } // ==================================================================== // RunInference / RunInferencesBatch / Destroy / Destructor // ==================================================================== std::vector