Класифікація військової техніки на основі методів комп’ютерного зору
Анотація
Найбільш поширеними засобами для вирішення завдань пошуку та виявлення цілей є засоби висотної розвідки, зокрема супутники, розвідувальні дрони та авіаційні комплекси. Дана робота фокусується на покращенні процесу знаходження та ідентифікації цілей шляхом імплементації системи автоматичного пошуку із використанням штучного інтелекту, з особливим акцентом на використання цієї технології на дронах, в умовах обмежених обчислювальних ресурсів. Метою роботи було створення моделі машинного навчання, яка дозволить локалізувати та класифікувати військову техніку за допомогою зображень, отриманих з безпілотних літальних апаратів. Методами дослідження є моделі машинного навчання, що використовуються для локалізації об’єктів на зображеннях, що базуються на підходах CNN, ResNet, Fast CNN, EfficientDet та YOLO. Було досліджено різні підходи комп’ютерного зору, на основі згорткових мереж для локалізації та класифікації військової техніки на зображеннях отриманих з безпілотних літальних апаратів. Найефективніше себе показав підхід, який базується на методі YOLO8. Узагальнена точність пропонованої моделі сегментації техніки на зображення становить 70 %, а точність класифікації наближається до 90 %, inference time пропонованої моделі становить менше 400 мілісекунд. Система приймає як вхідні дані зображення і повертає вхідне зображення із знайденою військовою технікою. Додатково проведено апробацію методів YOLO8 (nano, small, medium) у проблематиці розпізнавання та класифікації техніки на зображеннях з безпілотних літальних апаратів. Підхід виявився ефективним і має потенціал для подальшого застосування, а також покращення при наявності більших наборів. Система може використовуватися на практиці для оптимізації пошуку цілей, спрощуючи таким чином завдання для оператора безпілотних літальних апаратів. Також, у випадку подальшого доопрацювання та оптимізації під конкретні апаратні ресурси, має потенціал до впровадження у реальному секторі оборони. Потенційно дане вирішення може стати важливим інструментом для військової розвідки та інших суміжних галузей, де важлива точна ідентифікація об’єктів на зображеннях в реальному часі. Впровадження таких систем може значно підвищити ефективність і швидкість реагування в різних сценаріях використання безпілотних літальних апаратів
Ключові слова
локалізація; розпізнавання; маркування; згорткова нейронна мережа; аналіз зображень
Використані джерела
[1] Alzubaidi, L., et al. (2021). Review of deep learning: Concepts, CNN architectures, challenges, applications, future directions. Journal of Big Data, 8, article number 53. doi: 10.1186/s40537-021-00444-8.
[2] Benmhahe, B., & Chentoufi, J.A. (2021). Automated pavement distress detection, classification and measurement: A review. International Journal of Advanced Computer Science and Applications, 12(8), 708-718.
[3] Bochkovskiy, A., Wang, C.-Y., & Liao, H.-Y.M. (2020). YOLOv4: Optimal speed and accuracy of object detection. arXiv, 2004, article number 10934. doi: 10.48550/arXiv.2004.10934.
[4] Chen, X., Liu, C., Chen, L., Zhu, X., Zhang, Y., & Wang, C. (2024). A pavement crack detection and evaluation framework for a UAV inspection system based on deep learning. Applied Sciences, 14(3), article number 1157. doi: 10.3390/app14031157.
[5] Csurka, G., Volpi, R., & Chidlovskii, B. (2022). Semantic image segmentation: Two decades of research. Foundations and Trends® in Computer Graphics and Vision, 14(1-2), 1-162. doi: 10.1561/0600000095.
[6] Figshare. (2024). Vehicles and fortification image recognition dataset. doi: 10.6084/m9.figshare.25726470.
[7] Gavrilescu, R., Zet, C., Foșalău, C., Skoczylas, M., & Cotovanu, D. (2018). Faster R-CNN: An approach to real-time object detection. In International conference and exposition on electrical and power engineering (EPE) (pp. 165-168). Iasi: IEEE. doi: 10.1109/ICEPE.2018.8559776.
[8] Hussain, M. (2023). YOLO-v1 to YOLO-v8, the rise of YOLO and its complementary nature toward digital manufacturing and industrial defect detection. Machines, 11(7), article number 677. doi: 10.3390/machines11070677.
[9] Ippalapally, R., Mudumba, S.H., Adkay, M., & Vardhan, H.R.N. (2020). Object detection using thermal imaging. In 2020 IEEE 17th India Council international conference (INDICON) (pp. 1-6). New Delhi: IEEE India Council. doi: 10.1109/INDICON49873.2020.9342179.
[10] Iqbal, N., Mumtaz, R., Shafi, U., & Zaidi, S.M.H. (2021). Gray level co-occurrence matrix (GLCM) texture based crop classification using low altitude remote sensing platforms. PeerJ Computer Science, 7, article number e536. doi: 10.7717/peerj-cs.536.
[11] Ji, G.-P., Fan, D.-P., Chou, Y.-C., Dai, D., Liniger, A., & Gool, L.C. (2023). Deep gradient learning for efficient camouflaged object detection. Machine Intelligence Research, 20, 92-108. doi: 10.1007/s11633-022-1365-9.
[12] Kishore, A.S.K., & Balamurugan, G. (2024). Faster region based convolution neural network with context iterative refinement for object detection. Measurement: Sensors, 31, article number 101025. doi: 10.1016/j.measen.2024.101025.
[13] Liang, J. (2020). Image classification based on RESNET. Journal of Physics: Conference Series, 1634, article number 012110. doi: 10.1088/1742-6596/1634/1/012110.
[14] Mohammadi, V., Sodjinou, S.G., Katakpe, K.K., Rosse, M., & Gouton, P. (2022). Development of a multi-spectral camera for computer vision applications. In 30. jubilee international conference in central Europe on computer graphics, visualization and computer vision (pp. 24-27). Plzen: Vaclav Skala University of West Bohemia. doi: 10.24132/CSRN.3201.4.
[15] Panwar, K., Singh, A., Kukreja, S., Singh, K.K., Shakhovska, N., & Boichuk, A. (2023). Encipher GAN: An end-to-end color image encryption system using a deep generative model. Systems, 11(1), article number 36. doi: 10.3390/systems11010036.
[16] Park, S., & Lee, H. (2021). Deep learning approach to optical camera communication receiver design. In 2021 IEEE region 10 symposium (TENSYMP) (pp. 1-5). Jeju: IEEE. doi: 10.1109/TENSYMP52854.2021.9550896.
[17] Sohan, M., Sai Ram, T., & Rami Reddy, C.V. (2024). A review on YOLOv8 and its advancements. In I.J. Jacob, S. Piramuthu & P. Falkowski-Gilski (Eds.), Data intelligence and cognitive informatics (pp. 529-545). Singapore: Springer. doi: 10.1007/978-981-99-7962-2_39.
[18] Tan, M., Pang, R., & Le, Q.V. (2020). EfficientDet: Scalable and efficient object detection. In IEEE/CVF conference on computer vision and pattern recognition (CVPR) (pp. 10778-10787). Seattle: IEEE. doi: 10.1109/CVPR42600.2020.01079.
[19] Vijayakumar, A., & Vairavasundaram, S. (2024). YOLO-based object detection models: A review and its applications. Multimedia Tools and Applications, 83, 83535-83574. doi: 10.1007/s11042-024-18872-y.
[20] Yang, S., Jiang, L., Liu, Z., & Loy, C.C. (2023). GP-UNIT: Generative prior for versatile unsupervised image-to-image translation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(10), 11869-11883. doi: 10.1109/TPAMI.2023.3284003.
[21] Zhang, D., Wang, C., & Fu, Q. (2024). A new benchmark for camouflaged object detection: RGB-D camouflaged object detection dataset. Open Physics, 22(1), article number 20240060. doi: 10.1515/phys-2024-0060.
[22] Zhang, Z., Xie, X., Guo, Q., & Xu, J. (2024). Improved YOLOv7-Tiny for object detection based on UAV aerial images. Electronics, 13(15), article number 2969. doi: 10.3390/electronics13152969.
[23] Zhao, Z.-Q., Zheng, P., Xu, S.-T., & Wu, X. (2019). Object detection with deep learning: A review. IEEE Transactions on Neural Networks and Learning Systems, 30(11), 3212-3232. doi: 10.1109/TNNLS.2018.2876865.
[24] Zhou, W., Gao, S., Zhang, L., & Lou, X. (2020). Histogram of oriented gradients feature extraction from raw bayer pattern images. IEEE Transactions on Circuits and Systems II: Express Briefs, 67(5), 946-950. doi: 10.1109/TCSII.2020.2980557.
[25] Zou, Z., Chen, K., Shi, Z., Guo, Y., & Ye, J. (2023). Object detection in 20 years: A survey. Proceedings of the IEEE, 111(3), 257-276. doi: 10.1109/JPROC.2023.3238524.