[조세금융신문] MS, 업무용 에이전트에 여러 AI모델 간 논평·회의 모델 도입

MS, 업무용 에이전트에 여러 AI모델 간 논평·회의 모델 도입

2026.03.31 02:31:44

단일 모델 대비 모든 지표에서 더 높은 평가…의학 부문은 54.5% 향상

(조세금융신문=최주현 기자) 마이크로소프트(MS)가 업무용 심층 연구 에이전트인 '리서처'에 여러 인공지능(AI) 모델을 한꺼번에 이용할 수 있는 기능을 도입했다.

30일(현지시간) 연합뉴스에 따르면 사티아 나델라 MS 최고경영자(CEO)는 이날 링크트인에 "'M365 코파일럿'에서 사용할 수 있는 새로운 멀티모델 심층연구 시스템 '크리틱'(Critique·논평)을 소개한다"며 "여러 모델을 한꺼번에 써서 최적의 답변과 보고서를 생성할 수 있다"고 말했다.

크리틱은 AI 모델 둘을 이용해 하나는 연구와 답변 생성을 담당하고, 나머지 하나는 타당성 검증과 표현력 향상, 구조 강화 등 논평을 맡는 접근 방식을 택했다.

예를 들어 오픈AI의 GPT 모델이 보고서를 작성하면, 앤트로픽의 '클로드' 모델이 그 보고서를 논평해 결과를 향상하는 방식이다.

이때 논평 모델은 정보 출처가 신뢰할 만한지, 보고서가 완성도 있게 작성됐는지, 보고서의 주장이 근거로 뒷받침되는지 등을 검토한다.

MS는 심층 연구의 정확성·완전성·객관성을 평가하는 벤치마크 'DRACO'를 통해 크리틱의 성능을 평가한 결과, 단일 모델 방식과 견줘 ▲ 분석의 폭과 깊이 ▲ 발표 품질 ▲ 사실적 정확도 ▲ 인용 품질 등 4가지 지표 모두에서 더 높은 평가를 받았다고 설명했다.

특히 의학 부문에서는 54.5% 더 높은 점수를 얻었고, 일반지식(+30%)과 기술(+28.7%) 부문에서도 단일 모델 방식보다 더 높은 점수를 기록했다.

MS는 크리틱과 달리 두 모델이 동시에 보고서를 작성하는 '카운슬'(Council·회의)도 함께 선보였다.

GPT와 클로드가 각기 보고서를 작성하면 제3의 전용 심사 모델이 두 보고서를 논평해 주요 결과를 요약하고 두 모델 간 일치하는 내용과 차이가 있는 내용을 강조해 제시하는 방식이다.

MS는 신기능을 우선 체험할 수 있는 '프런티어' 이용자에게 먼저 이들을 선보이고, 이후 적용 대상을 확대해나갈 계획이다.

MS가 이처럼 다양한 모델의 비교·협업 기능 개발에 나설 수 있었던 것은 자사의 클라우드 플랫폼 '애저'가 상당 기간 GPT와 클로드를 함께 제공하는 멀티 모델 체제를 구축해왔기 때문이다.

구글 클라우드는 제미나이를 주요 AI 모델로 쓰고 있고, 아마존웹서비스(AWS)는 클로드를 주요 모델로 쓰다가 지난달 말 GPT 모델을 추가했다.

최주현 기자 chlwn761@tfnews.co.kr

최근기사

회사명 : 주식회사 조세금융신문 사업자 등록번호 : 107-88-12727 주소 : 서울특별시 은평구 증산로17길 43-1 (신사동 171-57) 제이제이한성B/D 인터넷신문등록번호 : 서울, 아01713 등록일자 : 2011. 07. 25 제호 : 조세금융신문 발행인:김종상 편집인:양학섭 발행일자 : 2014. 04. 20 TEL : 02-783-3636 FAX : 02-3775-4461 Copyright @ All rights reserved.

로그인

Search

MS, 업무용 에이전트에 여러 AI모델 간 논평·회의 모델 도입

단일 모델 대비 모든 지표에서 더 높은 평가…의학 부문은 54.5% 향상

인기기사

최근기사

공유하기