<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Command and Control</title>
<title_fa>فصلنامه علمی-پژوهشی فرماندهی و کنترل</title_fa>
<short_title>C4I Journal</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://ic4i-journal.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2645-7245</journal_id_issn>
<journal_id_issn_online>2645-8055</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi></journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1401</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2022</year>
	<month>11</month>
	<day>1</day>
</pubdate>
<volume>6</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>ناوبری خودمختار ربات چرخ‌ دار با رویکرد مبتنی‌ بر یادگیری تقویتی عمیق</title_fa>
	<title>Autonomous Navigation of Wheeled Robot using a Deep Reinforcement Learning Based Approach</title>
	<subject_fa>هوش مصنوعی</subject_fa>
	<subject>Artificial Intelligence</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:10pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt;در این پژوهش به بررسی یک رویکرد مبتنی&amp;rlm;بر یادگیری تقویتی عمیق برای ناوبری خودمختار ربات&amp;rlm;ها &amp;rlm;می&amp;rlm;&amp;rlm;پردازیم. رویکرد ما در این پژوهش، مبتنی&amp;rlm;بر الگوریتم &lt;/span&gt;&lt;span class=&quot;Char0&quot; style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;DDPG&lt;/span&gt;&lt;span class=&quot;Char0&quot; style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; و یکی از نسخه&amp;rlm;های بهبود یافته&amp;rlm;ی آن به نام &lt;/span&gt;&lt;/span&gt;&lt;span class=&quot;Char0&quot; style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;SD3&lt;/span&gt;&lt;span class=&quot;Char0&quot; style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; است. به&amp;rlm;منظور استفاده از این الگوریتم برای مسئله&amp;rlm;ی ناوبری خودمختار، اصلاحاتی بر روی الگوریتم مذکور انجام و برای کاربرد ناوبری&lt;/span&gt;&lt;/span&gt;&lt;span class=&quot;Char&quot; style=&quot;font-family:&amp;quot;Times New Roman&amp;quot;,serif&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; بهینه&amp;rlm;سازی شده است. الگوریتم اصلاح شده به علت داشتن لایه&amp;rlm;های کانولوشنی می&amp;rlm;&amp;rlm;تواند با فضاهای حالت&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; با ابعاد زیاد نیز کار کند. همچنین برای کاهش نوسان ربات در حین حرکت و نیز تشویق برای حرکت سریع&amp;rlm;تر در محیط، استفاده از دو پارامتر پاداش و جریمه براساس سرعت خطی و سرعت زاویه&amp;rlm;ای را پیشنهاد دادیم. و برای بهبود تعمیم پذیری الگوریتم، از الگوریتمی برای تغییر متناوب شکل و چینش موانع در محیط استفاده کردیم. همچنین برای تسریع فرایند یادگیری و بهبود عملکرد ربات، داده های ورودی را نرمال کردیم. سپس الگوریتم پیشنهادی را توسط محیط شبیه&amp;rlm;ساز &lt;/span&gt;GAZEBO&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; و سیستم عامل &lt;/span&gt;ROS&lt;span lang=&quot;FA&quot; style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; پیاده&amp;rlm;سازی کرده و نتایج بدست آمده را با الگوریتم اولیه&amp;rlm;ی &lt;/span&gt;SD3&lt;span style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; و الگوریتم &lt;/span&gt;DDPG&lt;span style=&quot;font-family:&amp;quot;B Lotus&amp;quot;&quot;&gt; مقایسه نمودیم. الگوریتم پیشنهادی عملکرد بهتری نسبت به این دو روش به نمایش گذاشته است.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;br&gt;
&amp;nbsp;</abstract_fa>
	<abstract>In this research we develop a deep reinforcement learning-based method for autonomous robot navigation. Our approach in this study is based on DDPG and one of its improved versions named SD3. We did some modifications on this algorithm to make it proper for autonomous navigation problems and optimize it for this problems. The modified algorithm can work with high dimensional state spaces because of using convolutional layers. Also we propose two reward terms include linear velocity reward and angular velocity penalty to encourage robot to move faster with smoother movements. For generalizing the algorithm we used an algorithm for randomly changing shape, layout and number of obstacles in the environment. And to speed up the learning process and improving the robot operation, we normalized all input data. Finally, the proposed algorithm is implemented with ROS and Gazebo and the results show improvement versus the main SD3 and DDPG algorithms.&lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;</abstract>
	<keyword_fa>ناوبری خودمختار, یادگیری تقویتی عمیق, DDPG, SD3</keyword_fa>
	<keyword>Autonomous navigation, Deep reinforcement learning, SD3, DDPG</keyword>
	<start_page>31</start_page>
	<end_page>45</end_page>
	<web_url>http://ic4i-journal.ir/browse.php?a_code=A-10-421-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Kourosh</first_name>
	<middle_name></middle_name>
	<last_name>Dadashtabar Ahmadi</last_name>
	<suffix></suffix>
	<first_name_fa>کوروش</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>داداش تبار احمدی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>dadashtabar@yahoo.com</email>
	<code>10031947532846002143</code>
	<orcid>10031947532846002143</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Malek Ashtar university of technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی مالک اشتر</affiliation_fa>
	 </author>


	<author>
	<first_name>Ali Akbar</first_name>
	<middle_name></middle_name>
	<last_name>Kiaei</last_name>
	<suffix></suffix>
	<first_name_fa>علی اکبر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>کیایی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ali.a.kiaei@gmail.com</email>
	<code>10031947532846002144</code>
	<orcid>10031947532846002144</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Malek Ashtar university of technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی مالک اشتر</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Amin</first_name>
	<middle_name></middle_name>
	<last_name>Abbaszadeh</last_name>
	<suffix></suffix>
	<first_name_fa>محمد امین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>عباس زاده</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>abbaszadeh.193@gmail.com</email>
	<code>10031947532846002145</code>
	<orcid>10031947532846002145</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Malek Ashtar university of technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی مالک اشتر</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
