AI는 사람보다 공정할 수 있을까 [스토리팩-제네시스랩①]

디지털데일리 [스토리팩-제네시스랩] 첫 회의 내용 요약입니다. 뷰인터HR이 400만 건의 면접 영상으로 학습했고, TTA 신뢰성 평가 항목을 모두 통과하며 공정성을 어떻게 담보했는지 살펴봅니다.

Share
AI는 사람보다 공정할 수 있을까 [스토리팩-제네시스랩①]

“AI는 사람보다 공정할 수 있을까.” 디지털데일리가 연재 기획 [스토리팩-제네시스랩] 첫 회에서 던진 질문입니다. 제네시스랩이 개발한 AI 영상면접 솔루션 뷰인터HR은 현대자동차·LG유플러스·육군 등 150여 곳의 대기업·공공기관 채용에 쓰이고 있는데, 이 글은 공정성을 어떻게 담보했는지 그 뒷단을 들여다봅니다.

뷰인터HR의 학습 데이터는 실제 면접 영상 약 400만 건입니다. 전문 면접관과 HR 담당 임원, 산업심리학자가 각각 평가한 결과를 정답지로 썼고, 분량으로 치면 전문 면접관 약 220명의 평생 경력에 맞먹습니다. 평가의 일관성을 확인하려고 같은 지원자를 반복 평가하게 했고, 합의되지 않는 평가자는 학습 데이터에서 제외했습니다.

부정 방지는 얼굴인식 기반 본인 확인, 지원자 간 답변 표절 탐지, 대리 응시 차단으로 짰습니다. 평가 결과의 근거는 면접 스크립트 안의 +/- 구간 시각화로 면접관이 확인합니다. 한국정보통신기술협회(TTA) AI 신뢰성 평가에서는 해당되는 13개 요구사항과 41개 검증 항목을 모두 통과했고, 2023년 ‘인공지능 신뢰성·품질 대상’에서 과학기술정보통신부 장관상을 받았습니다.

고객이 뷰인터HR을 도입한 이유를 묻자 신뢰성이 21%로 가장 높았고, 비용 효율성이 12%로 뒤를 이었습니다. AI가 사람보다 ‘더 완벽하게’ 공정하다고 주장하기보다, 그 공정성을 어떻게 드러내 보여줄지에 무게를 둔 설계입니다.

원문: 디지털데일리 — 대기업이 택한 ‘AI 면접관’ 개발 비하인드 [스토리팩-제네시스랩①]

Read more

단일 LLM의 한계를 넘어서: Multi-Agent System은 왜 필요한가

단일 LLM의 한계를 넘어서: Multi-Agent System은 왜 필요한가

단일 LLM으로 복잡한 비즈니스 문제를 해결하는 접근은 현실에서 쉽게 한계에 부딪힌다. 이 글에서는 단일 프롬프트부터 멀티 에이전트 시스템에 이르기까지 AI 아키텍처의 발전 단계를 분석하고, 각 구조가 왜 실패하거나 부족했는지 그 이유를 짚는다. 그리고 그 흐름 속에서 도출되는 멀티 에이전트 스케일링 법칙이 B2B 플랫폼 설계에 어떤 시사점을 주는지 살펴본다.