이 영역을 누르면 첫 페이지로 이동
StudyDiary 블로그의 첫 페이지로 이동

StudyDiary

페이지 맨 위로 올라가기

StudyDiary

reinforcement learning

  • StudyDiary
ML4CO 2 - Neural Combinatorial Optimization with RL

ML4CO 2 - Neural Combinatorial Optimization with RL

2022.07.24
https://arxiv.org/abs/1611.09940 요약 TSP 문제는 Node가 많아질 경우 Optimal Solution을 구하기 어려워 지도학습에 활용할 데이터셋을 구하기 어려움 이를 해결하기 위해 TSP문제를 강화학습으로 해결하는 모델 제안 배경지식 다음의 내용을 알고 있으면 글을 이해하기 편합니다. 조합 최적화 (Combinatorial Optimization) TSP 강화학습 (Reinforcement Learning) Pointer Network 배경 조합 최적화 문제란 이산적(Discrete)이거나 이산적으로 환원(Reduction) 가능한 탐색 공간에서 최적의 해를 찾는 문제입니다. 대표적인 문제로는 Traveling Salesman Problem (TSP), Knapsack Pr..
  • 최신
    • 1
  • 다음

정보

StudyDiary 블로그의 첫 페이지로 이동

StudyDiary

  • StudyDiary의 첫 페이지로 이동

검색

메뉴

  • 홈
  • 태그
  • 방명록

카테고리

  • 분류 전체보기 (10)
    • Machine Learning (2)
      • PR113 (1)
    • 회고 (3)
      • 일주일 회고 (0)
      • Today I Learned (3)

최근 글

인기 글

댓글

공지사항

아카이브

태그

  • TSP
  • til
  • gnn
  • combinatorial optimization
  • PR113
  • 도커
  • ml4co
  • 리눅스

나의 외부 링크

정보

Understand의 StudyDiary

StudyDiary

Understand

블로그 구독하기

  • 구독하기
  • RSS 피드

방문자

  • 전체 방문자
  • 오늘
  • 어제

티스토리

  • 티스토리 홈
  • 이 블로그 관리하기
  • 글쓰기
Powered by Tistory / Kakao. © Understand. Designed by Fraccino.

티스토리툴바