우리는 여러 형태의 문자와 언어, 행동 등으로 ‘소통’하고 있다. 가장 오래전부터 이어지고 있는 원초적인 형태다. 이것이 스마트 시대에 이르면서 변화를 거듭하고 있다. 사람과 사람 사이의 대화와 명령이 아니라 그사이에 기계가 개입하면서다. 그 덕에 시간과 장소의 제약을 받지 않고 소통할 수 있게 되었지만 분명한 것은 기기에 명령을 내려야만 가능하다는 점이다. 물론 ‘소통’이라는 본질은 변하지 않았다. 다만 우리가 흔히 사용 중인 매개체에 대한 ‘경험’의 변화가 시작된 것이다.
가장 기본인 ‘문자 입력’ 부터 변화하고 있다
기기를 사용하는 데 있어 가장 기초가 되는 소통 방식은 ‘입력’이다. 전화를 하려면 번호 다이얼을 돌리거나 숫자 버튼을 입력하던 것이 그 시작이다. 이것이 스마트폰으로 진화하면서 문자 입력으로 변했다. 중요한 것은 버튼이 아니라 화면을 손 끝으로 터치해 입력하게 됐다는 점이다. 입력 가능 영역이 물리 버튼에서 디스플레이로 확장되었기에 가능한 일이다.
최근 스마트폰 디스플레이는 과거에 비하면 엄청난 발전을 이뤄냈다. 3~4인치 크기에서 시작했던 면적은 현재 5~6인치를 넘어 7인치 전후에 달할 정도다. 갤럭시 노트 10 같은 스마트폰만 보더라도 전면 대부분이 디스플레이로 구성되어 있다. 그만큼 문자 입력은 편리해졌다.
안타깝게도 버튼을 누를 때의 짜릿한 ‘손맛’은 사라졌지만 큼직한 풀스크린 OLED 디스플레이를 바라보며 마치 컴퓨터 키보드를 사용하는 듯한 느낌으로 타이핑하거나 필요한 명령을 입력할 수 있다. 이 외에도 과거의 입력 자판(천지인, 스카이, 나랏글, 단모음 등)도 선택 가능해 취향에 맞춰 쓸 수 있다. 과거와 같이 기기에 따라 입력 방식이 정해진 것이 아니라 하나의 기기에 여러 입력 방식을 사용할 수 있게 됐다.
과거의 변화는 다양한 입력 방식을 통합해 제공하는 것으로 시작했다면, 현재는 입력 편의성에 무게를 두고 있다. 부족한 손끝의 감각을 기술로 보완하는 것이다. 여기에 인공지능과 빅데이터 등 최신 IT 기술이 보이지 않는 곳에서 활약하고 있다.
▲ 갤럭시 S10 키보드 자동완성 기능 (출처: 익스트림 매뉴얼)
당신의 목소리와 몸짓도 입력에 쓰인다
▲ 스마트폰 음성인식 빅스비 (출처: 삼성전자 뉴스룸)
문자 입력의 변화를 넘어 이제 스마트폰은 우리의 목소리와 몸짓까지 알아채고 있다. 먼저 빠르게 확산 중인 음성인식 기술은 삼성 갤럭시 스마트폰에 탑재되고 있는 빅스비(Bixby)를 비롯해 애플의 시리(Siri), 구글 어시스턴트(Google Assistant), 아마존 알렉사(Alexa)에 이르기까지 종류가 다양하다.
음성인식 기술은 인공지능과 밀접한 연관이 있다. 사람의 목소리를 학습하고 분석한 이후, 필요한 명령을 수행하는 형태로 진행되는 구조다. 단순히 사람이 말하는 언어만 이해하고 관련 명령을 수행한다면 음성인식에서 마무리되지만, 인공지능 기술로 진화하려면 꾸준히 쌓인 음성을 학습(머신러닝)하고 해당 사용자만의 명령을 세밀하게 수행할 수 있어야 한다.
목소리만으로 명령을 내렸을 때의 편리함은 이루 말할 수 없다. 리모컨을 찾아야 할 필요도 없고, 직관적이지만 세밀한 제어가 가능하다. 스마트폰 외에 다양한 가전기기에 음성인식 기술이 적용되면서 활용 범위도 넓어지고 있다. 이제는 기기를 켜고 끄거나 간단한 기능을 수행하는 것을 넘어서, 말 한마디로 필요한 물품을 바로 구매하고 기기의 유지보수 등이 가능한 시대로 접어들고 있다. 최근 개발된 음성인식 기술의 사례로, SK텔레콤은 시각장애인 전용 음성도서 제공 서비스인 ‘행복을 들려주는 도서관’에 AI 스피커 ‘누구’ 서비스를 도입하여 시각장애인의 도서 정보접근성을 한결 높였다. 뿐만 아니라, 음성으로 조작할 수 있는 책갈피 기능을 통해 책 읽기 중단지점도 지정할 수 있다.
▲ 갤럭시 탭 S6 제스처를 인식하는 스마트 S펜 (출처: 삼성전자 뉴스룸)
음성인식 다음으로 떠오르고 있는 입력 방식은 바로 몸짓(제스처) 인식이다. 카메라나 센서를 활용해 사용자의 움직임이나 손짓 등을 분석, 그에 맞는 명령을 수행하는 방식이다. 터치가 어렵거나 직접 말하기 힘든 환경에서 최적인 기술. 최근에는 심도를 분석하는 카메라와 센서 등을 조합해 제스처 인식률을 높여 나가는 중이다.
▲ 갤럭시 S10 유용한 제스처 & 기능 10가지 (출처: 유튜브 맥가이버 채널)
제스처 기술에 인공지능이 더해지면 사용자 맞춤형 서비스가 가능해진다. 만약 덥다고 손짓한다면 이를 인식해 냉방장치를 가동하거나, 시원한 음료를 권할 것이다. 특정 행동을 등록해 둔다면 그것을 실행하는 것으로 기기를 편리하게 제어할 수 있게 된다. 손가락을 돌려 TV를 켠다든지, 손뼉을 친 다음 “누구에게 전화해줘”라고 말하면 스마트폰이 켜진 후 전화를 걸어주는 식이다. 제스처 기술의 사례로, 카카오내비는 휴대폰에 손을 가까이 대면 반응하는 제스처 호출을 통해 음성명령을 시작할 수 있는 기능을 선보였고, 구글은 안드로이드 10 버전부터 손짓으로 스마트폰 동작을 제어하는 제스처 내비게이션 기능을 도입해 사용편의성을 높였다.
스마트폰으로 두드리기만 해도 사물을 인식하고 상호작용까지
▲ 스마트폰 두드리면 사물을 인식하는 기술 개발 (출처:YTN 사이언스)
최근 국내연구진은 스마트폰으로 사물을 똑똑 두드리면 사물의 종류가 스마트폰에 입력되는 ‘노커’ 기술을 개발했다. 노커 기술은 스마트폰을 물체에 두드려 생긴 반응을 학습하고 분석해 유형화한 것이다. 노커 기술은 카메라나 전자태그 등 기존 인식 장치를 이용하지 않기 때문에 카메라를 쓰기 어려운 어두운 곳이나 태그가 없는 기기에 적용할 수 있다. 또 사물을 인식한 후 관련된 기능을 스마트폰에서 구현하는 방향으로도 연구가 이어지고 있다. 예를 들어, 소화기를 노크하면 소화기 작동법을 알려주는 영상이 폰에서 바로 뜨게 하는 식이다. 노커 기술은 음성, 제스처 인식에 이은 새로운 소통 기술로, 향후 물통에 스마트폰을 두드리기만 해도 물을 곧바로 주문하는 등 새로운 서비스에 이용될 수 있을 것으로 전망된다.
모든 기술은 편의를 위해
스마트폰을 비롯한 여러 기기는 문자, 음성, 제스처 등 우리가 쓰는 언어와 행동을 분석하고 이해하는 중이다. 그 결과, 손에 쥐고 있는 스마트 기기로 귀찮은 업무를 간단히 해결할 수 있게 됐다. 리모컨을 찾아 이리저리 버튼을 누르고, 단말기를 굳이 찾아갈 필요가 없다. 당신의 일거수일투족은 물론이고, 말 한마디까지 놓치지 않고 있으니 말이다.
이것이 얼마나 중요할까? 단순히 편의만 증가하는 것이 아니다. 자신의 삶의 질이 달라질 수 있다. 기기를 다루기 위해 여러 형태로 소비되는 짧은 시간만큼, 다른 것에 몰두할 수 있다. 여가 시간을 확보하거나, 가정일 혹은 업무에 더 집중할 수도 있다. 1분 1초가 아까운 이 시대에 시간을 효과적으로 쓴다는 것은 축복이라면 축복이다. 기기가 당신을 이해하는 일도 그 목적을 달성해 주기 위한 과정이라 하겠다. 손에 쥐고 있는 스마트폰은 이제 단순히 콘텐츠를 즐기기 위한 도구가 아닌 스마트 시대를 열어가는 열쇠이다.
※ 이 칼럼은 해당 필진의 개인적 소견이며 삼성디스플레이 뉴스룸의 입장이나 전략을 담고 있지 않습니다.