[신화통신 뉴스] 中 최초 '사이버 학생' 화즈빙, 벌써 164종 안무 배워

Source: Xinhua| 2021-06-18 19:05:19|Editor: huaxia

(베이징=신화통신) 웨이멍자 기자 = 대학 입시 시즌을 맞아 중국 최초의 사이버 학생 '화즈빙(華智冰)'이 다시 한 번 주목받고 있다. 그는 이달 초 칭화대 컴퓨터학과에 입학했다. 그는 칭화대에서 어떻게 공부하고 있을까?

최근 열린 칭화대 컴퓨터학과 '화즈빙' 성과 발표회에서 탕제(唐杰) 교수는 화즈빙의 얼굴과 목소리가 모두 AI 모델링을 거쳐 만들어졌다고 소개했다. 탕 교수는 이 과정에 1조7천500억 개의 매개변수(알고리즘의 구성요소)를 갖춘 '우다오(悟道) 2.0'이 사용됐다고 덧붙였다. 화즈빙은 이 인공신경망을 통해 중국어·영어·그림 등을 인식하고 표현할 수 있다.

탕 교수는 "화즈빙이 AI 학습을 통해 인간처럼 생각하고 한층 더 나아가 튜링 테스트 이상의 인지 능력을 갖출 수 있기를 바란다"고 말했다. 탕 교수는 차세대 AI가 '적응 및 학습' '오류 탐지 및 편집' '의사결정 및 실행' 등 9가지 능력을 갖추어야 한다고 설명했다.

탕제교수가 지난 15일 칭화대 컴퓨터학과 '화즈빙' 성과 발표회에서 발언하고 있다. (취재원 제공)

자자(賈珈) 칭화대학교 컴퓨터학과 부교수는 화즈빙의 외형·목소리·표정·입모양·몸짓의 생성을 담당했다. 그는 생동감 있고 다양한 스타일의 캐릭터를 창조하기 위해 정밀도 높은 3D 표정을 제작하느라 팀원들이 고생했다고 소개했다. 또 광범위한 3D 페이스 모델링을 통해 낮은 비용으로 미세한 표정을 포함해 각 상황에 어울리는 세부 동작을 스스로 학습할 수 있다는 점이 화즈빙의 특징 중 하나다.

자 부교수는 "사람마다 발음 특성이 다르다"며 "입을 크게 벌리고 말하는 사람이 있는 반면 작게 벌리고 말하는 사람도 있다"고 말했다. 이어 "우리는 각기 다른 인간 영상을 화즈빙에 입력한 후 각 설정에 따라 같은 텍스트도 입 모양을 달리 표현할 수 있도록 만들었다"고 설명했다.

화즈빙은 음악에 맞춰 춤도 출 수 있다. 개발팀은 음악에 따라 종류가 다른 춤 동작의 움직임을 기록해 데이터 세트로 만들어 화즈빙에게 가르쳤다. 현재 화즈빙은 총 164종의 안무를 배웠다.

사이버 학생 '화즈빙'. (취재원 제공)

개발팀은 화즈빙이 입학 후에도 끊임없이 공부해야 한다고 강조했다. 개발팀은 화즈빙에게 '언어자료'를 끊임없이 입력해 텍스트·시각·이미지·동영상 등 데이터에 포함된 패턴을 지속적으로 학습시킬 예정이다. 이를 통해 인간처럼 끊임없이 주변 경험을 통해 지식·경험을 습득하고 성장해 점점 더 똑똑해지도록 만들겠다는 계획이다.

이와 함께 개발팀은 화즈빙의 감수성을 키우는 데도 주력할 예정이다. 단순히 질문에 대답하는 게 아닌 친구나 가족처럼 자연스럽고 즐겁게 상호작용하도록 만들겠다는 것이다. 자 부교수는 "화즈빙이 감성지수를 높여 언어 생성 과정에서 각 상황에 적합한 감정을 표현하길 바란다"며 "예를 들어 화즈빙이 어린이들에게 이야기를 들려줄 때 (의식적으로) 상냥한 목소리를 내는 식"이라고 설명했다.

칭화대 컴퓨터학과 개발팀이 지난 15일 '화즈빙' 성과 발표회에서 취재진의 질문에 답하고 있다. (취재원 제공)

류즈위안(劉知遠) 칭화대 컴퓨터학과 부교수는 시 짓기를 예로 들며 대량의 텍스트·이미지 등 관련 매개변수를 기반으로 관련 주제·감정 등을 통제할 수 있다고 말했다.

탕 교수는 향후 화즈빙이 여러 인지 능력 방면에서 인간을 뛰어넘을 수 있으리라 기대하고 있다. 이미지를 인식하고 시를 쓰거나 그림을 그리고 수학 문제를 푸는 수준을 넘어 (스스로) 프로그래밍하고 코드를 사용해 홈페이지를 만들 수 있는 수준까지 도달하는 게 개발팀의 목표다. "아마도 그때쯤이면 화즈빙도 졸업할 수 있을 것"이라며 "화즈빙 본인도 매우 힘든 과정이 될 것"이라고 전했다.