<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Command and Control</title>
<title_fa>فصلنامه علمی-پژوهشی فرماندهی و کنترل</title_fa>
<short_title>C4I Journal</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://ic4i-journal.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2645-7245</journal_id_issn>
<journal_id_issn_online>2645-8055</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi></journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1402</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2023</year>
	<month>11</month>
	<day>1</day>
</pubdate>
<volume>7</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>بهبود جستجتوی یادگیری تقویتی عمیق با بهینه سازی مستعمره مورچه</title_fa>
	<title>Improving search for deep reinforcement learning with ant colony optimization</title>
	<subject_fa>مهندسی کامپیوتر</subject_fa>
	<subject>Computer Engineering</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p&gt;&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;font-family:Calibri,&quot;&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;ظهور اکوسیستم عظیم اینترنت اشیا&lt;/span&gt;&lt;a href=&quot;#_ftn1&quot; name=&quot;_ftnref1&quot; title=&quot;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-size:11.0pt&quot;&gt;[1]&lt;/span&gt;&lt;/strong&gt;&lt;/a&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt; (&lt;/span&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;IoT&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;) در حال تغییر سبک زندگی انسان است. اینترنت اشیا هنوز هم متکی به کمک های انسانی است و زمان پاسخ دهی غیرقابل قبول برای بررسی داده های بزرگ دارد و همچنان با چالش های قابل توجهی روبرو هستند. بنابراین، ایجاد چارچوب و الگوریتم جدید برای حل مشکلات خاص اینترنت اشیا سریع، بسیار ضروری است. رویکردهای یادگیری تقویتی و یادگیری تقویتی عمیق&lt;/span&gt;&lt;a href=&quot;#_ftn2&quot; name=&quot;_ftnref2&quot; title=&quot;&quot;&gt;&lt;sup&gt;&lt;strong&gt;&lt;sup&gt;&lt;span style=&quot;font-size:11.0pt&quot;&gt;[2]&lt;/span&gt;&lt;/sup&gt;&lt;/strong&gt;&lt;/sup&gt;&lt;/a&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt; (&lt;/span&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;DRL&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;) توانایی تصمیم گیری را دارند، اما روشهای مدلسازی و آموزش سنتی، وقت گیر بوده و کاربردهای آنها را محدود می کنند. این مقاله برای غلبه بر این معضل، روش یادگیری تقویتی متناسب با اینترنت اشیا را پیشنهاد می کند. به این صورت که یک روش انتخاب ویژگی مبتنی بر بهینه سازی مستعمره مورچه&lt;/span&gt;&lt;a href=&quot;#_ftn3&quot; name=&quot;_ftnref3&quot; title=&quot;&quot;&gt;&lt;sup&gt;&lt;strong&gt;&lt;sup&gt;&lt;span style=&quot;font-size:11.0pt&quot;&gt;[3]&lt;/span&gt;&lt;/sup&gt;&lt;/strong&gt;&lt;/sup&gt;&lt;/a&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt; (&lt;/span&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;ACO&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;) پیشنهاد می کنیم. از آنجا که توابع اکتشافی بر روند تصمیم گیری &lt;/span&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;ACO&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt; در طی فرآیند جستجو تأثیر می گذارد، استفاده از روش یادگیری ابتکاری می تواند به الگوریتم کمک کند تا در فضای جستجو بهتر جستجو کند. سرانجام، به عنوان مطالعه موردی اینترنت اشیا، روش پیشنهادی برای کنترل چراغ راهنمایی، با هدف کاهش ازدحام ترافیک در تقاطع های شهرهای هوشمند، اعمال می شود. نتایج تجربی نشان می دهد که روش پیشنهادی می تواند در مقایسه با رویکردهای سنتی، اقدامات بهتری را در زمان اجرای کوتاهتر بیاموزد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;

&lt;div&gt;&amp;nbsp;
&lt;hr&gt;
&lt;div id=&quot;ftn1&quot;&gt;&lt;span style=&quot;font-size:10pt&quot;&gt;&lt;span style=&quot;font-family:Calibri,&quot;&gt;&lt;a href=&quot;#_ftnref1&quot; name=&quot;_ftn1&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:8.0pt&quot;&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt; &lt;span dir=&quot;LTR&quot; lang=&quot;EN-GB&quot; style=&quot;font-size:7.0pt&quot;&gt;Internet of Things&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn2&quot;&gt;&lt;span style=&quot;font-size:10pt&quot;&gt;&lt;span style=&quot;font-family:Calibri,&quot;&gt;&lt;a href=&quot;#_ftnref2&quot; name=&quot;_ftn2&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:8.0pt&quot;&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;[2]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt; &lt;span dir=&quot;LTR&quot; style=&quot;font-size:8.0pt&quot;&gt;Deep Reinforcement Learning&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn3&quot;&gt;&lt;span style=&quot;font-size:10pt&quot;&gt;&lt;span style=&quot;font-family:Calibri,&quot;&gt;&lt;a href=&quot;#_ftnref3&quot; name=&quot;_ftn3&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:7.0pt&quot;&gt;&lt;span style=&quot;font-size:7.0pt&quot;&gt;[3]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt; &lt;span dir=&quot;LTR&quot; style=&quot;font-size:7.0pt&quot;&gt;Ant Colony Optimization&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;
&lt;/div&gt;</abstract_fa>
	<abstract>The emergence of the massive Internet of Things (IoT) ecosystem is changing human lifestyles. The Internet of Things still relies on human assistance and has unacceptable response times for analyzing big data, and still faces significant challenges. Therefore, it is very necessary to create a new framework and algorithm to solve the specific problems of fast Internet of Things. Reinforcement learning and deep reinforcement learning (DRL) approaches have the ability to make decisions, but traditional modeling and training methods are time-consuming and limit their applications. To overcome this problem, this article proposes a reinforcement learning method suitable for the Internet of Things. In this way, we propose a feature selection method based on ant colony optimization (ACO). Since the heuristic functions affect the decision-making process of ACO during the search process, the use of heuristic learning method can help the algorithm to search the search space better. Finally, as a case study of IoT, the proposed method is applied to traffic light control, with the aim of reducing traffic congestion in smart city intersections. Experimental results show that the proposed method can learn better actions in a shorter execution time compared to traditional approaches.</abstract>
	<keyword_fa></keyword_fa>
	<keyword></keyword>
	<start_page>1</start_page>
	<end_page>11</end_page>
	<web_url>http://ic4i-journal.ir/browse.php?a_code=A-10-319-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mohammad</first_name>
	<middle_name></middle_name>
	<last_name>Hassan Nataj Solhdar</last_name>
	<suffix></suffix>
	<first_name_fa>محمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>حسن نتاج صلحدار</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>nataj.solhdar@gmail.com</email>
	<code>10031947532846002434</code>
	<orcid>10031947532846002434</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه شهید چمران اهواز_پردیس صنعتی شهدای هویزه</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
