스타트업
액션파워, 기록관리 AI 서비스 ‘다글로’ 성능 업그레이드…“음성기록 관리의 혁명”
- 음성인식 정확도 100% 근접 개선
여러 사람 목소리 분리 인식 가능
완벽에 가까운 ‘텍스트 변환’ 탑재

[이코노미스트 정두용 기자] 액션파워(공동대표 조홍식·이지화)가 성능을 크게 개선한 기록관리 인공지능(AI) 서비스 ‘다글로’의 새로운 모델을 출시했다고 27일 밝혔다.
‘다글로’는 ‘음성기록 관리의 혁명’이라는 평가를 받으며 30만 이상의 회원에게 회의·통화·강의 영상을 텍스트로 변환하고 정리해 주는 서비스를 제공하고 있다.
이번 성능 개선의 핵심은 크게 세 가지다. STT(Speech-to-Text) 모델 자체의 크기를 확대해 음성인식 정확도 자체를 100%에 가깝게 개선했다. 음성 감지(VAD) 기능도 크게 높였다. 여러 사람의 대화에서도 목소리를 정확하게 분리해 낸다. 숫자와 영어 발음까지 명확하게 표시해 ‘거의 완벽한’ 텍스트 변환에 가독성까지 높인 결과를 도출한다는 게 회사 측 설명이다.
액션파워 다글로 관계자는 “다글로가 지향하는 궁극적인 가치는 ‘사람이 손대지 않아도 대화와 영상, 음성 기록이 알아서 정리되는 것’”이라며 “이번 성능 개선을 통해 다글로는 한국어와 영어 음성변환에서 최고 수준을 자랑하는 동시에, 정교한 화자 분리까지 지원한다는 점에서 오픈AI(OpenAI)의 음성 인식 모델 위스퍼(Whisper)와 격차를 더욱 크게 벌릴 수 있을 것으로 보인다”고 밝혔다.
액션파워는 이를 위해 지속해 다양한 기술을 적용하면서 사용성을 높이고 있다. 다글로와타 음성변환 서비스와의 가장 큰 차별점으로는 멀티모달(Multi-modal) 지원이 꼽힌다. 멀티모달의 대표적인 기능은 영상 파일을 올리거나 유튜브 링크를 붙여 넣으면, 바로 영상의 음성을 원고로 생성한다는 점이다.
또 크롬 확장 프로그램으로 다글로를 설치할 수 있어 유튜브 영상을 시청하면서 바로 다글로로 텍스트 변환이 가능하다. 긴 영상에서 빠르게 중요한 부분만 파악하고 싶거나 강의 영상을 원고로 함께 보기 원하는 사용자들이 많이 사용하는 기능이다. 또한 변환 결과는 일반 문서 파일뿐 아니라 자막 파일로도 바로 다운로드할 수 있도록 사용자 편의성을 높였다.
회사는 상반기 마지막 업데이트 예정하고 있다. 통화 내용을 바로 텍스트로 변환하고 보여주는 기능이 추가된다.
이지화 액션파워 공동대표(CTO)는 “AI는 인간의 시간과 노력을 아껴준다는 점에서 가치가 있다. 신기하고 재미있는 유행이 아니라, 진짜로 사람에게 도움이 되는 기술에만 집중하고 있다. 감당할 수 없이 많은 정보와 대화들이 오가는 이 세상에서 다글로가 제공하는 ‘정리’라는 가치는 그래서 중요하다”고 말했다.
다글로 관계자는 “이제 액션파워의 목표는 개발 막바지 단계인 자체 LLM 상용화에 맞춰져 있다. 지금 다글로는 원고를 생성하고 키워드를 뽑아주고 요약을 해준다. 그리고 앞으로는 회의 후 실행할 일들과 다음 일정까지 정리해서 알려주고, 영상에서는 가장 많이 시청된 부분만 따로 뽑아서 요약해 줄 것”이라며 “다글로는 우리 모두의 일상을 위한 진짜 ‘AI 조수’(AI assistant)로 성장하고 있다”고 설명했다.
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
당신이 좋아할 만한 기사
브랜드 미디어
브랜드 미디어
“가양대교도 잠겨” SNS로 전해진 서울 피해 상황
세상을 올바르게,세상을 따뜻하게이데일리
이데일리
마켓인
누가 KBO 최초로 3000안타 기록할 인물인가
대한민국 스포츠·연예의 살아있는 역사 일간스포츠일간스포츠
일간스포츠
일간스포츠
하루 240㎜ 넘는 `괴물폭우` 수도권 덮쳤다
세상을 올바르게,세상을 따뜻하게이데일리
이데일리
이데일리
[단독]반려동물 700만 시대 ‘펫 장례’에 베팅…프랙시스, 21그램 품는다
성공 투자의 동반자마켓인
마켓인
마켓인
‘생물보안법’·‘임신중지약 합법화’ 관련주 활짝…‘방광암진단’ 지노믹트리도 상승[바이오맥짚기]
바이오 성공 투자, 1%를 위한 길라잡이팜이데일리
팜이데일리
팜이데일리