SNS활용사 3

챗 GPT 주요배경기술 Ⅷ (인간피드백기반 강화학습의 정의, 배경기술, 적용사례, 결론)

정 의 강화 학습(RL)은 시행 착오를 통해 특정 목표를 달성하기 위해 에이전트가 환경과 상호 작용하는 기계 학습 유형입니다. 에이전트는 환경에서 작업을 수행할 때 보상 또는 처벌의 형태로 피드백을 수신하여 학습합니다. 시간이 지남에 따라 에이전트의 목표는 의사 결정 프로세스를 최적화하여 받는 누적 보상을 최대화하는 것입니다. 인간 피드백 기반 강화 학습은 인간 전문가의 귀중한 통찰력으로 기존 RL을 보강하는 접근 방식입니다. 이 패러다임에서 인간은 학습 에이전트에 피드백과 지침을 제공하는 멘토 역할을 합니다. 피드백은 보상 신호, 선호도 비교 또는 직접 수정과 같은 다양한 형태를 취할 수 있습니다. 인간의 지식을 통합함으로써 RL 알고리즘은 더 빠른 학습, 더 나은 일반화 및 보상 신호가 희박하거나 정..

카테고리 없음 2023.07.31

Chat GPT 인공지능시대의 시작과 개념 정의

■ 인공지능시대의 시작     세계 2차 대전 중 개발된 ‘컴퓨터의 빠르고 정확한 계산 능력을 경험한 전문가들은 단순한 계산을 넘어 “글을 읽고,     쓰고,사물을 알아보는 기계 역시 가능하지 않을까?‘라는 질문을 가지고 먼저 수식과 코딩을 통해 기계에게 세상을     설명해 주었지만, 수십 년 넘는 노력에도 불구하고 기계는 ‘고양이’와 ‘강아지' 조차 구별하지 못했다. 이에 인간의     언어를 이해하는 기계는 영원히 불가능해 보였다.      2010년 충격적인 사건, 인간의 뇌를 모방한 ‘딥러닝’ 알로리즘, 빅데이터, 그리고 병렬정보처리가 가능한 GPU     프로세서가 등장하게 되었고, 인류 역사상 처음으로 세상을 알아보는 기계가 탄생하게 되었다.     그러나, 인공지능이 여전히 해결하지 못한..

Chat GPT 2023.07.16

알아야 면장 하제! 면장 출신 명강사 블로그에 오신 걸 진심으로 환영합니다!

#1. 행정 경력 34년, 전라북도 임실군 관촌면장 출신, 블로거 김명진입니다. 34년의 공직을 마감을 앞두고 퇴직을 준비하면서 제2의 인생을 어떻게 시작할까 늘 고민하다가 2년전부터 꾸준하게 준비해온 농촌과 관련된 내용과, 최근 챗GPT의 출시로 온 세상이 급격히 변화될 것에 대비하여 많은 강의와 수많은 책들을 읽고 공부하고 유튜브를 통해 직접 따라 해가면 학습한 내용으로 강의안을 만들고 직접 강사로 열심히 뛰고 있습니다. 네이버 블로그를 운영하다 지속적인 수입 루트를 만들기 위해 Tistory로 갈아타고 한걸음 한걸음씩 꾸준히 걸어가고 있습니다. 제 블로그를 찾아주신 분들께 다양한 내용으로 도움이 될수 있는 내용으로 꾸며 드리겠습니다. 많은 관심을 부탁드리며 많이 많이 찾아주시면 많은 유익이 되도록 ..

카테고리 없음 2023.07.12