신활력플러스 2

챗 GPT 주요배경기술 Ⅷ (인간피드백기반 강화학습의 정의, 배경기술, 적용사례, 결론)

정 의 강화 학습(RL)은 시행 착오를 통해 특정 목표를 달성하기 위해 에이전트가 환경과 상호 작용하는 기계 학습 유형입니다. 에이전트는 환경에서 작업을 수행할 때 보상 또는 처벌의 형태로 피드백을 수신하여 학습합니다. 시간이 지남에 따라 에이전트의 목표는 의사 결정 프로세스를 최적화하여 받는 누적 보상을 최대화하는 것입니다. 인간 피드백 기반 강화 학습은 인간 전문가의 귀중한 통찰력으로 기존 RL을 보강하는 접근 방식입니다. 이 패러다임에서 인간은 학습 에이전트에 피드백과 지침을 제공하는 멘토 역할을 합니다. 피드백은 보상 신호, 선호도 비교 또는 직접 수정과 같은 다양한 형태를 취할 수 있습니다. 인간의 지식을 통합함으로써 RL 알고리즘은 더 빠른 학습, 더 나은 일반화 및 보상 신호가 희박하거나 정..

카테고리 없음 2023.07.31

챗GPT 주요배경기술 Ⅶ ; 클라우드 컴퓨팅이란 ? (정의, 필요성, 작동원리, 적용사례 )

클라우드 컴퓨팅이란 무엇인가? 우리는 기존의 산업(의료, 물류, 제조 등)이 IT 기술과 결합하면서, 산업 간의 경계가 흐려지고 서비스가 융합되는 4차 산업혁명 시대에 살고 있습니다. 기업 비즈니스는 이처럼 IT 기술을 기반으로 하는 디지털 전환Digital Transformation을 바탕으로 새로운 경쟁력을 갖추지 못하면 생존하기 어려운 위기에 봉착 했습니다. 4차 산업혁명 시대에 글로벌 리더 국가로의 발전을 위해 대두되는 5대 기술인 ICBMA(IoT, Cloud, BlockChain, Mobile, Artificial Intelligence) 중에서 기반 기술이자, 시발점start point인 기술은 ‘클라우드’입니다. 그 이유는 클라우드가 비즈니스의 비용 절감과 생산성 향상, 효율성 증가에 가장..

카테고리 없음 2023.07.26