Data/독서

[리뷰]챗GPT 거부할 수 없는 미래-기본개념,업무활용,API,파인튜닝

뚱요 2023. 5. 8. 09:00
반응형

2023년 상반기 최고로 헤드라인을 많이 장식한 키워드는 chatGPT라고 생각이 됩니다. chatGPT는 출시 2개월 만에 MAU 1억 명을 가장 빠르게 달성하며 검색 시장에도 큰 변화를 몰고 올 것으로 보입니다. 서치엔진의 검색 방식을 키워드 검색에서 대화형 인터페이스로 바꾸는 건 뿐 아니라 산업이나 개인의 생산성에 직접적으로 미치는 영향력을 느낄 수 있습니다. 
그래서 관련 컨텐츠가 폭발적으로 인기가 급증하고 있고 책들도 활용 잘할 수 있는 것에 셀링포인트를 맞춰 출간되고 있습니다. 그중 책 한 권으로 관련 기본 개념, 다양한 서비스 소개와 관련 사용방법, 업무에서 활용 시나리오까지 다룬 책을 통해서 활용 방법에 대해서 알아보기 위해서 리뷰하였습니다. 

챗GPT 거부할 수 없는 미래

chatGPT 개념, 동작 원리 이해

출판사: (주)도서출판 길벗
저자:서지영
분량: 220페이지
출간일: 2023년 4월 20일
정가: 19,000원

 

 

책구성

챗GPT 사전지식 및 기본 개념, 사용법, 활용 케이스로 크게 4가지로 나누어집니다. 
1부에서 chatGPT 이해를 위한 사전지식으로 자연어 처리에 대한 기본 개념과 관련 알고리즘을 소개합니다. 이 부분은 이해를 부가적으로 돕기 위한 페이지로 기본적으로 머신러닝이나 자연어처리에 대한 이해가 있다면 2부 부터 보아도 무리 없었습니다. 
2부에서는 chatGPT 소개 및 다양한 서비스들을 소개합니다.

chatGPT는 OpenAI에서 개발한 대규모 언어모델을(Large Language Model, LLM) 기반으로 한 대화형 인공지능 서비스입니다. 마이크로소프트에서 투자하였으며 작년에는 美의사면허, 로스쿨 시험 합격 접을 받았습니다.
사용 방법은 프롬프트(Prompt)로 사용자로 부터 질의를 받으면 chatGPT는 대답으로 컴플리션(Completion)이라는 프로세스를 거치는데 질문 방식에 따라서 답변이 상이해지고 질문 길이는 무료/유료 서비스에 따라서 토큰 개수가 제한되어 있습니다. 아시다시피 일반적인 데이터들을 학습했기 때문에 만능이 아니며 모든 답변을 할 수 없습니다. 아래와 같이 chatGPT3는 2021년까지 학습하여 이후의 내용은 답변 불가하나 유료 버전인 플러스로 업그레이드하게 되면 이후 내용도 반영되어 있습니다.

영어로 작성한 내용을 구글 번역기로 번역하여 어색하게 나왔습니다.

3부에서는 실제 chatGPT 사용방법에 대해서 이미지와 함께 소개되어 차근차근 따라서 할 수 있게 소개되어 있다. 책에서는 OpenAI 사이트 내 GUI, OpenAI API, Azure 내 OpenAI를 통해 사용하는 방법 3가지를 소개하여 첫 번째만 바로 따라 해 보았습니다. 그리고 chatGPT와 음성변환 Whisper로 실제로 퓨샷러닝하는 방법을 python 코드로 누구나 따라 할 수 있게 소개되어 범용적이지 않고 원하는 샘플 데이터에 맞춰 학습하도록 파인튜닝 하는 방법도 소개하고 있다. 그래서 실제로 학습해서 적용해 보는 단계까지 활용하는 방법을 구체적으로 제시합니다. 

4부에서는 유스 케이스로 콘텐츠 요약, 콘텐츠 생성, 학습을 위한 가이드라인으로 제시합니다. 업무에서 적용점으로 사수가 없거나 모르는 내용에 대한 답변 찾기나 코딩이나 메일 자동완성 등에 대한 활용점으로 제시하고 있습니다. 이외 서비스로 이미지 생성 AI로 필요한 이미지를 생성해서 사용할 수 있음을 예시로 제시했다. 그리고 chatGPT 활용 범위가 넓어지면서 chatGPT로 생성된 글인지 판단하는 zeroGPT, GPTzero, AI text Classifier로 사용에 대해서도 다룹니다.

특징

1. 전문성
이 책의 저자가 Microsoft(마이크로소프트)에서 Data & AI Specialist로 근무하고 있어 산업과 분야에 대한 전문성이 책에 녹여있음이 느껴졌습니다. 책 내부에서도 4장 전체가 오픈 AI와 마이크로소프트에 관해서 결합된 코파일럿 서비스가 무엇이 있고 어떤 기능을 하는지에 대해서 다루고 있습니다. 뒷 페이지에도 Azure에서 OpenAI 서비스 사용방법도 다루고 어떻게 구성해야 하는지 소개하고 있습니다.


2. 압축된 가이드라인
약 200페이지 내에 개념, 다양한 서비스, 사용법, 활용 시나리오에 다루고 있어 가볍게 읽기 좋습니다. 그럼에도 자연어 처리 모델 개념과 히스토리부터 chatGPT가 무엇이고  어떻게 발전해 왔고 어떠한 제한점이 있는지 빠르게 살펴볼 수 있습니다. 그리고 비교 시 표나 도표로 비교 정리되어 있어 이해가 쉬웠고 사용법에서 스크린캡처한 이미지가 첨부되어 있어서 따라 하기 어렵지 않았습니다. 

 

3. 다양한 활용법 소개

MS 365 코파일럿(파워포인트, 엑셀, 워드, 팀즈 등의 MS 365 제품에 GPT-4 결합), chatGPT GUI로 이용하는 방법부터 API로 직접 퓨샷러닝하는 예시 코드와 함께 사용방법을 소개하고 있어 활용하고자 하는 내용을 빠르게 훑고 사용 시나리오를 파악하기 좋습니다.

 

후기

해당 책에서는 chatGPT 개념과 원리에 대해서 설명해 주고 특히 저자가 MS 출신이어서 MS 프로덕트 중심으로의 활용 사례가 많다고 느꼈습니다. 그래서 MS 365(워드, 엑셀, 아웃룩, 파워포인트, 팀즈), Azure를 사용하고 있는 경우 더욱 유용합니다. 

대부분의 분량은 chatGPT 사용 법에 대해서 안내하고 잘 활용하는 방법이 비교적 적어 아쉬웠습니다. 2 부 chatGPT소개에서 질문하는 방법에 따라 답변이 달라진다고 한 페이지에 내용 비교되어 있지만 여기서 프롬프트 질의 팁도 소개되었다면 뒤의 활용 시나리오도 더욱 의미가 있지 않을까 싶었습니다. OpenAI chatGPT, Dall-E등 LLM을 사용하면서 질의 방식에 따가 결과물의 퀄리티가 달라진다고 느꼈으며 실무에서 적용하는 수준이면 이런 팁이 더 실용적이지 않았을까 생각되었습니다.(예. 연쇄 프롬프트, Top-p , 파인튜닝 매개변수 조정 등)

Dall-E라는 text-to-image 생성형 모델을 통해서 생성된 반고흐 스타일로 그려진 고양이

그리고 AI의 대부이자 메타의 CSAI( Chief AI Scientist)인 얀 르쿤은 chatGPT 포함한 LLM은 아직 고양이의 지능보다 낮다고 하였습니다. 결국 결과물에 대한 판단은 최종 사용자의 판단이 가장 중요하기 때문에 이러한 맹점을 좀 더 강조했으면 어떠하였을까 싶습니다.

LLM에 대한 얀르쿤의 트윗

 

이 글은 (주)도서출판 길벗에서 도서를 제공받아 작성한 서평입니다.
반응형