본문 바로가기

탐색과활용1

강화학습의 기본 원리와 요소: 경험을 통한 지능의 창발 작성자: sonslab | 발행일: 2025년 3월 28일들어가며아마도 많은 사람들이 2016년 구글 딥마인드의 알파고(AlphaGo)가 이세돌 9단을 4:1로 이기고, 이후 커제 9단을 3:0으로 제압한 역사적 사건을 기억하실 겁니다. 이미 AI 발전의 중요한 이정표가 된 이 순간은, 강화학습의 놀라운 가능성을 세계에 보여주었죠. 알파고가 초기에는 인간의 기보를 모방하는 지도학습에서 출발했지만, 이후에는 자기 자신과의 대국을 통해 스스로 실패와 성공을 거듭하며 고차원적인 전략을 습득했습니다. 이는 마치 어린아이가 처음에는 모방을 통해 기초를 배우고, 이후에는 직접 경험을 통해 능력을 향상시키는 과정과 놀랍도록 유사합니다. 특히 2017년에 등장한 알파고 제로(AlphaGo Zero)는 인간의 지식 없이.. 2025. 3. 28.

이전 1 다음

티스토리툴바