در این پژوهش به بررسی یک رویکرد مبتنیبر یادگیری تقویتی عمیق برای ناوبری خودمختار رباتها میپردازیم. رویکرد ما در این پژوهش، مبتنیبر الگوریتم DDPG و یکی از نسخههای بهبود یافتهی آن به نام SD3 است. بهمنظور استفاده از این الگوریتم برای مسئلهی ناوبری خودمختار، اصلاحاتی بر روی الگوریتم مذکور انجام و برای کاربرد ناوبری بهینهسازی شده است. الگوریتم اصلاح شده به علت داشتن لایههای کانولوشنی میتواند با فضاهای حالت با ابعاد زیاد نیز کار کند. همچنین برای کاهش نوسان ربات در حین حرکت و نیز تشویق برای حرکت سریعتر در محیط، استفاده از دو پارامتر پاداش و جریمه براساس سرعت خطی و سرعت زاویهای را پیشنهاد دادیم. و برای بهبود تعمیم پذیری الگوریتم، از الگوریتمی برای تغییر متناوب شکل و چینش موانع در محیط استفاده کردیم. همچنین برای تسریع فرایند یادگیری و بهبود عملکرد ربات، داده های ورودی را نرمال کردیم. سپس الگوریتم پیشنهادی را توسط محیط شبیهساز GAZEBO و سیستم عامل ROS پیادهسازی کرده و نتایج بدست آمده را با الگوریتم اولیهی SD3 و الگوریتم DDPG مقایسه نمودیم. الگوریتم پیشنهادی عملکرد بهتری نسبت به این دو روش به نمایش گذاشته است.
Dadashtabar Ahmadi K, Kiaei A A, Abbaszadeh M A. Autonomous Navigation of Wheeled Robot using a Deep Reinforcement Learning Based Approach. C4I Journal 2022; 6 (2) :31-45 URL: http://ic4i-journal.ir/article-1-295-fa.html
داداش تبار احمدی کوروش، کیایی علی اکبر، عباس زاده محمد امین. ناوبری خودمختار ربات چرخ دار با رویکرد مبتنی بر یادگیری تقویتی عمیق. فصلنامه علمی-پژوهشی فرماندهی و کنترل. 1401; 6 (2) :31-45