[뉴스에프엔 김맹근 기자] 대부분의 AI는 시계와 달력을 읽는 데 어려움을 겪는다는 연구 결과가 나왔다.
에든버러 대학교 연구진은 세계에서 가장 발전된 인공지능(AI) 시스템 중 일부가 시계의 시간을 읽고 달력 날짜를 계산하는 데 어려움을 겪고 있다는 연구 결과를 14일 발표했다. 이는 복잡한 작업을 수행할 수 있는 AI가 인간에게는 비교적 쉬운 일상적 기술을 여전히 완전히 습득하지 못했음을 보여준다.
연구팀은 텍스트와 이미지를 동시에 처리하는 MLLM(Multimodal Large Language Model)을 활용해 시계와 달력 관련 질문에 대한 AI의 정확도를 테스트했다. 다양한 디자인의 시계를 활용한 실험에서 AI는 로마 숫자, 초침 유무, 다이얼 색상에 따라 인식 정확도가 크게 달라졌다. 연구 결과에 따르면 AI는 시계 바늘의 위치를 정확하게 읽어내는 데 25% 미만의 성공률을 보였으며, 로마 숫자나 복잡한 디자인일수록 실수가 더 잦았다.
달력 관련 테스트에서도 비슷한 문제가 발견됐다. 연구팀은 AI 모델이 공휴일 식별, 날짜 계산 등 기본적인 달력 작업에서 20%가량의 오류율을 보였다고 밝혔다. 이는 시간 감지 및 수리적 계산의 한계를 보여주는 결과다.
연구를 이끈 에든버러 대학교 정보학부의 로히트 삭세나(Rohit Saxena) 교수는 "대부분의 사람들은 어릴 때부터 시간을 읽고 달력을 사용하는 법을 배운다. 그러나 AI 시스템은 여전히 이런 기본적인 능력에서 인간과 큰 격차가 있다"며 "AI가 스케줄링 어시스턴트, 자율 로봇, 시각 장애인을 위한 도구 등 시간에 민감한 실제 애플리케이션에 완전히 통합되려면 이러한 기술적 한계를 반드시 극복해야 한다"고 말했다.
같은 연구팀의 아리오 게마(Aryo Gema) 연구원은 "AI 연구는 복잡한 추론과 창의적 작업에 초점을 맞추는 경우가 많지만, 정작 단순하고 일상적인 과제에서 아직도 많은 시스템이 실수를 반복한다"며 "이러한 격차를 해소하지 않으면 AI는 마치 11시에 멈춘 시계처럼 시간 중심의 실생활 응용에서 제자리걸음을 할 수 있다"고 덧붙였다.
이번 연구는 2025년 4월 28일 싱가포르에서 열리는 '제13차 ICLR(International Conference on Learning Representations)'의 대규모 언어 모델 추론 및 계획 워크숍에서 발표될 예정이다. 연구진은 이를 통해 AI의 시간 이해 능력을 개선하기 위한 후속 연구를 이어갈 계획이다.