ظهور اکوسیستم عظیم اینترنت اشیا[1] (IoT) در حال تغییر سبک زندگی انسان است. اینترنت اشیا هنوز هم متکی به کمک های انسانی است و زمان پاسخ دهی غیرقابل قبول برای بررسی داده های بزرگ دارد و همچنان با چالش های قابل توجهی روبرو هستند. بنابراین، ایجاد چارچوب و الگوریتم جدید برای حل مشکلات خاص اینترنت اشیا سریع، بسیار ضروری است. رویکردهای یادگیری تقویتی و یادگیری تقویتی عمیق[2] (DRL) توانایی تصمیم گیری را دارند، اما روشهای مدلسازی و آموزش سنتی، وقت گیر بوده و کاربردهای آنها را محدود می کنند. این مقاله برای غلبه بر این معضل، روش یادگیری تقویتی متناسب با اینترنت اشیا را پیشنهاد می کند. به این صورت که یک روش انتخاب ویژگی مبتنی بر بهینه سازی مستعمره مورچه[3] (ACO) پیشنهاد می کنیم. از آنجا که توابع اکتشافی بر روند تصمیم گیری ACO در طی فرآیند جستجو تأثیر می گذارد، استفاده از روش یادگیری ابتکاری می تواند به الگوریتم کمک کند تا در فضای جستجو بهتر جستجو کند. سرانجام، به عنوان مطالعه موردی اینترنت اشیا، روش پیشنهادی برای کنترل چراغ راهنمایی، با هدف کاهش ازدحام ترافیک در تقاطع های شهرهای هوشمند، اعمال می شود. نتایج تجربی نشان می دهد که روش پیشنهادی می تواند در مقایسه با رویکردهای سنتی، اقدامات بهتری را در زمان اجرای کوتاهتر بیاموزد.
Hassan Nataj Solhdar M. Improving search for deep reinforcement learning with ant colony optimization. C4I Journal 2023; 7 (2) :1-11 URL: http://ic4i-journal.ir/article-1-395-fa.html
حسن نتاج صلحدار محمد. بهبود جستجتوی یادگیری تقویتی عمیق با بهینه سازی مستعمره مورچه. فصلنامه علمی-پژوهشی فرماندهی و کنترل. 1402; 7 (2) :1-11