reinforcement learning
ML4CO 2 - Neural Combinatorial Optimization with RL
ML4CO 2 - Neural Combinatorial Optimization with RL
2022.07.24https://arxiv.org/abs/1611.09940 요약 TSP 문제는 Node가 많아질 경우 Optimal Solution을 구하기 어려워 지도학습에 활용할 데이터셋을 구하기 어려움 이를 해결하기 위해 TSP문제를 강화학습으로 해결하는 모델 제안 배경지식 다음의 내용을 알고 있으면 글을 이해하기 편합니다. 조합 최적화 (Combinatorial Optimization) TSP 강화학습 (Reinforcement Learning) Pointer Network 배경 조합 최적화 문제란 이산적(Discrete)이거나 이산적으로 환원(Reduction) 가능한 탐색 공간에서 최적의 해를 찾는 문제입니다. 대표적인 문제로는 Traveling Salesman Problem (TSP), Knapsack Pr..