AI

AI 에이전트, 직장에 준비됐을까? 새로운 벤치마크의 의문

최근 AI 에이전트가
직장에서 역할을
할 준비가 되었는지
여부를 두고
논란이 많습니다. 🤔

AI의 발전과

지연

마이크로소프트 CEO
사티아 나델라가
AI가 지식 노동을
대체할 것이라
예측한 지 거의
2년이 지났습니다.
그러나 그 변화는
아직 더디게 진행되고
있습니다.
기초 모델들은
깊이 있는 연구와
계획을 마스터했지만,
대부분의 화이트칼라
직종은 여전히
영향을 받지 않았습니다.

새로운 연구 결과

Mercor라는
훈련 데이터 거대 기업의
새로운 연구 덕분에
우리는 드디어 일부
답을 얻고 있습니다.
이 연구는 AI 모델들이
실제 화이트칼라 업무를
어떻게 수행하는지를
살펴보았습니다. 그 결과,
APEX-Agents라는
새로운 벤치마크가
등장했지만,
모든 AI 실험실이
낙제점을 받고 있습니다. 💔

복잡한

작업의
도전

법률, 투자은행,
컨설팅에서 추출한
질문들을 직면한
최고의 모델들조차
정확한 답변을
내놓지 못했습니다.
질문 중 일부는
복잡한 분석과
다양한 도메인의
정보 추적을
요구합니다.

예를 들어,
EU의 생산 중단
사태 시,
개인 데이터를
미국의 분석
벤더로
전송할 수 있는지
여부에 대한
질문이 있습니다.
이러한 복잡한
질문에 대한
정확한 답변은
심도 있는 법률
이해를 필요로 합니다.

AI의

미래

AI 분야는
도전적인
벤치마크를
통과하는
역사를 가지고
있습니다.
APEX-Agents 테스트가
이제 공개되면서,
AI 연구소들이
더 나은 성과를
내기 위해 도전할
것입니다. 💪

출처: TechCrunch

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다