컴퓨터 스스로 시행착오를 통해 문제를 해결해나가는 강화학습, 그 가능성은 무궁무진하죠. 봐봐요

컴퓨터 스스로 시행착오를 통해 문제를 해결해나가는 강화학습, 그 가능성은 무궁무진하죠. 봐봐요

카테고리 없음 2020. 2. 13. 08:22

>

안녕하세요 이경재 강사님 인터뷰로 이미 간단한 소개 부탁드립니다.현재강화학습을연구하고있는이경재라고합니다. 제가관념으로갖고있는연구주제는강화학습에사람의사전지식을추가해서학습과정을안전하고효율적으로하는것입니다. 사람의 사전지식을 추가하는 것은 로봇이 과인 자율주행 등 안전성이 보장되어야 할 시스템에 강화학습을 적용하기 위해 꼭 필요한 기술 중 하과인입니다. 강화학습이뭐죠? 왜 강화학습을 공부할 필요가 있는지 설명을 부탁드립니다.강화학습이란 컴퓨터가 주어진 문재를 해결하기 위해 어떤 행동을 순차적으로 해야 하는지를 스스로 시행착오적으로 학습하는 방법을 말한다. 강화학습은최근에알려졌지만사실상당히오랫동안연구되어온분야에요. 최근 들어 아탈리게이더, 바둑 등에서 인간보다 높은 성능을 낼 수 있다는 사실이 알려지면서 지상서, 주목을 받기 시작했고 현재는 로봇의 지능적 제어, 자율주행 등 다양한 분야에 대한 접목이 시도되고 있는 분야입니다. 시간에 따라 의사자결을 해야 하는 문재를 인공지능을 이용해서 풀고 싶다면 꼭 필요한 기술입니다.강화학습은 배우기 어렵다고 들었는데 그 이유가 뭐죠? 많은 분들이 수학에 대해 어려움을 느끼는 것 같아요. 강화학습이 수학에 많은 기반을 두고 있기 때문에 많은 변수가 복잡하게 얽혀있는 수식을 접하는 경우가 많습니다. 가상가상의 이 수식을 프로그래밍 언어로 구현하기까지는 가야 하며, 거의 아내의 소리 강화 학습을 공부하고 무언가를 직접 구현해보면 오류가 생겨 제대로 학습이 이루어지지 않는 경험을 했을 것입니다. 저도 마찬가지였습니다. 최근에 많이 들었을 Deep Reinforcement Learning의 경우, 강화학습뿐만 아니라 딥러닝도 조합되어 있기 때문에 두 분야를 함께 공부해야 하고 당연히 구현도 함께 해야 한다. 이 부분에서 공부해야 할 양과 난이도가 모두 높은 분야라고 생각한다.그런 어려움을 [Tensor Flow로 시작하는 강화학습 입문 CAMP]에서는 어떤 방법으로 해결해 주는 방안입니까?이론과 실습을 병행하여 강의가 진행됩니다. 강화학습 분야는 관련 서적이 많지만 영어 강의가 대부분이고 역시 중간 유도 과정을 많이 생략한다. 이처럼 유도과정이 없어 독학으로는 이해하기 힘든 부분의 이해를 돕는 것을 이론 파트의 쟁점으로 삼으려 한다. 강의에서는 기초지식부터 최근 논문의 실장에 필요한 이론까지 다루는 방안으로 실습시간에는 이론시간에 배운 수식이 어떻게 프로그래밍 언어로 구현되는지를 보여주는 것이 목표입니다. 강의에는 어떤 내용이 중점적으로 다뤄지는지 과인가요?본 강의에서는 이론에 익숙하지 않은 분들께 강화학습 이론과 친숙해질 수 있도록 구성되어 있으며, 책에는 설명되지 않은 부분까지 함께 제시하여 강의가 끝난 후에 스스로 강화학습을 공부하고 과나 최근 논문을 구현할 수 있도록 기초를 다지는 것을 목표로 하고 있습니다.강의 커리큘럼에 대한 전반적인 설명 부탁드립니다. 1~3주차에는 강화 학습에서 가장 중요한 이론을 배웁니다. 다소리 4~8주째에 사용되는 이론을 중점적으로 배우는 시기입니다. 4~6주째는 최근 강화 학습의 논문을 주제별로 소개시키고 드리겠습니다. 주로 Open AIgym을 이용하여 실습이 이루어지고, Atari 게이지를 학습시키는 방법도 다루는 방법입니다. 7~8주차에는 강화 학습을 실용적으로 활용하는데 필요한 테크닉을 소개 드릴게요.커리큘럼에 주마다 논문 리뷰가 있는데, 이것은 어떻게 진행됩니까? 강의에서는 고전적인 강화학습부터 최근 강화학습까지 다룹니다. 고전강화학습은 주로 Sutton의 책을 따라 이루어지는데, 최근 강화학습을 소개하는 경우에는 각 주기마다 할당된 논문의 내용을 정리해 제공합니다. 수업내용도 각 논문의 이론과 구현, 실습으로 이루어집니다. 그래서 수업 전에 이 논문을 한 번 읽어보면 이해하는데 많은 도움이 될 것 같습니다.수강대상은 어떤 것이 좋을까요? 딥강화학습은기계학습(Machine Learning)의전반적인지식을요구하기때문에지도학습과비지도학습을접해본사람들에게추천합니다. 역시이론을전개할때확률론이많이사용되기때문에기계학습을한번공부해보는게쉽게공부할수있을것같습니다.마지막으로 강의에 '관념'을 가지고 계신 분들에게 이야기를 부탁드립니다. 강화학습은 앞으로 많은 분야에서 활용될 수 있는 기술이라고 생각합니다. 수식이 어려우신 분, 구현이 어려우셨던 분들에게 도움이 되었으면 한다. 본 강의를 통해 강화학습을 공부하고 원하는 에이전트를 그때그때 학습할 수 있었으면 좋겠습니다.

이하의 화상을 클릭해 주세요!VVV

>

댓글

ABOUT ME

오전 오전

티스토리툴바