124. 심층강화학습을 활용한 우선순위 기반 계층적 교통 신호 최적화 / 김현수, 탁혜영, 유화평, 여화수
관리자
포스터
0
153
09.24 18:19
+ 5
124.pdf (857.8K)
포스터세션, , 27(금) 12:50-13:20, 라카이볼룸Ⅱ
심층강화학습을 활용한 우선순위 기반 계층적 교통 신호 최적화 / 김현수(한국과학기술원(KAIST)), 탁혜영(한국과학기술원(KAIST)), 유화평(한국과학기술원(KAIST)), 여화수(한국과학기술원(KAIST))
도시화로 인한 교통 혼잡 문제는 환경 오염과 경제적 손실을 유발하고 있어 효과적인 교통 신호 제어의 중요성이 부각되고 있다. 전통적인 교통 신호 제어는 복잡한 교통 패턴에 대응하기 어려운 반면, 다중 에이전트 강화학습(MARL)은 교통 변화에 적응 가능한 잠재력을 보여준다. 하지만 강화학습 기반 방법론은 에이전트의 보상함수와 교통 신호 제어의 목표 간 불일치, 그리고 현실 네트워크 적용의 어려움 등의 한계를 가지고 있다. 이를 해결하기 위해, 본 논문에서는 교차 엔트로피 방법(CEM)을 사용해 오프셋과 현시 배분을 우선순위에 따라 계층적으로 최적화하는 새로운 전략을 제안한다. 본 방법은 각 교차로의 서비스 수준(LoS)에 따라 제어 우선순위를 설정하고, 네트워크 전체의 통행 지체 시간을 보상함수로 사용해 개별 에이전트와 신호 제어 목표 간의 불일치를 해소한다. 오프셋과 현시 배분을 직접적으로 제어하고, 대한민국 교통신호 제어기 표준 규격을 준수하여 현실적 적용 가능성을 높인다.