AI 평가를 볼 때 남겨야 할 것

AI 시스템을 평가할 때는 좋은 사례만 모으면 부족하다. 실패 사례, 평가 기준, 사람이 개입해야 하는 경계도 같이 기록해야 한다.

특히 LLM 기반 도구는 “그럴듯해 보이는 성공”과 “반복 가능한 품질” 사이의 간격이 크다. 그래서 평가 노트에는 최소한 다음이 남아야 한다.