1) 게임 도메인에 특화된 LLM 벤치마크 구성
패치노트, 기획서, 가이드 등 게임 관련 문서를 기반으로 실제 이용자가 질문할 수 있는 시나리오와 벤치마크 질문을 설계
2) 평가 지표 및 기준 개발
객관적인 성능 비교가 가능하도록 평가 기준, 스코어링 방식, 품질 체크리스트 등 지표 설계
3) LLM 응답 품질 평가
AI가 문서를 바탕으로 사용자의 의도에 맞게 정확히 답변했는지 검색 및 답변 품질을 기준으로 정량/정성 평가 수행
4) 결과 분석 및 공유
평가 결과를 분석해 보고서로 정리하고 모델 개선을 위한 인사이트와 의견을 전달
서류전형 → 면접전형 → 최종합격
*해당 절차는 각 포지션 및 후보자에 따라 변동이 있을 수 있습니다.