오픈소스 Harness를 이용해 LLM 애플리케이션의 테스트를 자동화했습니다. lin.ee/DJIy3A0A 프롬프트 입력값에 따라 결과가 다른 LLM 애플리케이션은 테스트가 필요합니다. 테스트를 수동으로 진행하기에는 복잡하고 시간이 오래 걸려, Harness로 평가 자동화 시스템을 구축해 보았습니다.
0
6
12
1K
8
Download Image