logo

  • P-ISSN3022-8719

논문 상세

Home > 논문 상세
  • P-ISSN 3022-8719

인공 지능 강화 학습 개념과 실험 데이터 분석에 응용

Concept of Artificial Intelligence Reinforcement Learning and Applications to Experimental Data Analysis

과학과 과학교육 / Journal of Science and Science Education, (P)3022-8719;
2024, v.49 no.2, pp.66-74
https://doi.org/10.23335/JSSE.2024.49.2.66
정은석 (전북대학교 과학교육학부)
한상욱 (전북대학교 과학교육학부)
  • 다운로드 수
  • 조회수

초록

인공 지능 강화 학습은 환경과 에이전트 간의 상호작용을 통해 순차적인 문제를 해결하며, 보상을 기반으로 에이전트를 학습시키는 방법이다. 이것은 인공 신경망과 강화 학습을 결합한 심층 강화 학습으로 머신러닝의 지도 학습과 비지도 학습의 한계를 극복할 수 있는 가능성을 제시한다. 본 논문에서는 다이나믹 프로그래밍을 활용한 강화학습의 정책 반복 학습 과정을 기술하였다. 벨만 방정식으로부터 유도된 가치 함수 (Value Function)와 Q-함수가 그리드 월드 (Grid World) 환경에서 어떻게 적용되는지를 기술하여 강화 학습의 기본 개념을 상세히 설명하였다. 또한 심층 강화 학습 방법 중의 하나인 A3C (Asynchronous Advantage Actor-Critic) 알고리즘을 엑샆스 (EXAFS, Extended X-ray Absorption Fine Structure) 데이터 분석에 적용하여 심층 강화 학습이 과학 데이터 분석에 어떻게 활용될 수 있는지를 기술하였다.

keywords
강화 학습, 머신러닝, 딥러닝, 인공지능, 엑샆스

Abstract

Reinforcement learning (RL) is a method that addresses sequential decision-making problems by enabling an agent to interact with an environment and learn from rewards. Deep RL, a fusion of artificial neural networks and RL, shows promise in surpassing the constraints of supervised and unsupervised learning in machine learning. This study delves into the policy iteration learning process of RL using dynamic programming. It elaborates on how the value function and Q-function, derived from the Bellman equation, are leveraged in a Grid World environment to elucidate the core tenets of RL. Furthermore, practical applications of deep RL are showcased through the utilization of the A3C (Asynchronous Advantage Actor-Critic) algorithm in the analysis of Extended X-ray Absorption Fine Structure (EXAFS). This demonstration underscores the effective integration of deep RL in scientific data analysis.

keywords
Reinforcement learning, Machine learning, Deep learning, Artificial intelligence, EXAFS


상단으로 이동

과학과 과학교육