Skip to content

Reedgern/HS_Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

18 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

SaIL: Π²Ρ‹ΡƒΡ‡ΠΈΠ²Π°Π½ΠΈΠ΅ эвристик

ОписаниС ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°

РСализация Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Sail ΠΈΠ· ΡΡ‚Π°Ρ‚ΡŒΠΈ Learning Heuristic Search via Imitation.

Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ основноС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ удСляСтся Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ эвристик, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ явно ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‚ усилия поиска Π² интСрСсах ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. ΠšΠ»ΡŽΡ‡Π΅Π²Π°Ρ идСя Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ эвристики Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ: ΠΏΠΎ ΠΌΠ΅Ρ€Π΅ продвиТСния поиска ΠΎΠ½ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ΡŒ структуру допустимого пространства ΠΈ Π½Π°ΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ поиск Π½Π° ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ области.

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°

SaIL scheme

НСйронной ΡΠ΅Ρ‚ΡŒΡŽ аппроксимируСтся функция Q - Π΄Π»ΠΈΠ½Π° ΠΊΡ€Π°Ρ‚Ρ‡Π°ΠΉΡˆΠ΅Π³ΠΎ ΠΏΡƒΡ‚ΠΈ ΠΈΠ· Π²Π΅Ρ€ΡˆΠΈΠ½Ρ‹ v, Π² ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ‚ поиск ΠΈΠ· состояния s. На Π²Ρ…ΠΎΠ΄ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти подаётся ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²ΠΎΠ΅ описаниС Π²Π΅Ρ€ΡˆΠΈΠ½Ρ‹ v, Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰Π΅Π΅ Π² сСбя ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ срСды ΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ состояния поиска. Π’ΠΎ врСмя обучСния ΠΌΠ΅Ρ‚ΠΎΠ΄Π° для любой Π·Π°Π΄Π°Ρ‡ΠΈ планирования ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ значСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Q, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ДСйкстры. Π”Π°Π½Π½Ρ‹Π΅ значСния Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для обучСния Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Q ΠΊΠ°ΠΊ ΠΆΠ΅Π»Π°Π΅ΠΌΡ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹.

ΠŸΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ΡΡ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π²ΡƒΡ…ΡΠ»ΠΎΠΉΠ½ΡƒΡŽ ΠΏΠΎΠ»Π½ΠΎΡΠ²ΡΠ·Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ

arch

ДатасСт

Наборы ΠΊΠ°Ρ€Ρ‚ взяты ΠΈΠ· рСпозитория Π°Π²Ρ‚ΠΎΡ€Π° ΡΡ‚Π°Ρ‚ΡŒΠΈ. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ° ΠΊΠ°Ρ€Ρ‚ имССтся 1000 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°ΡΠΏΠΎΠ»Π°Π³Π°ΡŽΡ‚ΡΡ Π² ΠΏΠ°ΠΏΠΊΠ΅ с ΠΈΠΌΠ΅Π½Π΅ΠΌ Ρ‚ΠΈΠΏ ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠΈ ΠΏΠΎΠ΄Π΅Π»Π΅Π½Ρ‹ Π½Π° train(800), validation(100), test(100). ВсС ΠΊΠ°Ρ€Ρ‚Ρ‹ находятся Π² ΠΏΠ°ΠΏΠΊΠ΅ motion_planning_datasets.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹

ΠžΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ находятся Π² ΠΏΠ°ΠΏΠΊΠ΅ models. Имя Ρ„Π°ΠΉΠ»Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ = Ρ‚ΠΈΠΏ ΠΊΠ°Ρ€Ρ‚Ρ‹ + Π½ΠΎΠΌΠ΅Ρ€ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ обучСния, послС ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ данная модСль Π±Ρ‹Π»Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π°.

comparison

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Ρ‚Ρ€Π°Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΉ

trajectories

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •