Watson Speech to Text 검토 : 최고의 대량 전사 서비스? 리뷰

Watson은 IBM의 자연어 처리 컴퓨터 시스템입니다. Watson Speech to Text를 포함하여 유명한 질문 답변 슈퍼 컴퓨터와 일련의 AI 기반 엔터프라이즈 제품을 지원합니다. Watson Speech to Text 검토에서 오디오를 텍스트로 변환하려는 모든 사람에게 이상적인 최고의 Speech-to-Text 앱 중 하나를 살펴 보겠습니다..

Watson 음성 처리 플랫폼은 IBM Cloud에서 사용 가능합니다. 이 도구는 다양한 도구이며 받아쓰기 및 전화 회의 녹음을 포함한 여러 상황에서 사용할 수 있습니다. 또한 다른 대부분의 음성 텍스트 응용 프로그램과 달리 API로 제공되므로 개발자가 음성 제어 시스템에이를 포함시킬 수 있습니다..

Watson Speech to Text : 계획 및 가격

Watson Speech to Text를 사용하여 한 달에 최대 500 분의 오디오를 무료로 처리 할 수 ​​있습니다. 이보다 더 많이 변환하려면 각 오디오 분당 비용을 지불해야하며 처리 된 오디오 기간에 따라 요금이 변경됩니다. 비용은 분당 $ 0.01-$ 0.02이며 IBM의 사용자 정의 언어 모델이 필요한 경우 분당 $ 0.03의 추가 요금이 부과됩니다. 프리미엄 견적 전용 Watson 계획도 제공되며,이를 통해 향상된 데이터 개인 정보 보호 기능 및 가동 시간 보장에 대한 액세스 권한이 부여됩니다.

Watson의 음성 텍스트 서비스는 전사해야하는 콘텐츠의 양에 따라 가격이 책정됩니다. (이미지 크레디트 : IBM)

범용 IBM Cloud 구독을 통해 Watson Speech to Text 시스템에 액세스 할 수도 있습니다. 자연어 처리는 IBM Cloud를 통해 얻을 수있는 광범위한 AI 서비스에서 하나의 앱일 뿐이므로 고속 데이터 전송, 챗봇 또는 텍스트 음성 변환 도구에 액세스해야하는 모든 조직에 적합한 옵션입니다..

Watson Speech to Text : 기능

유연한 API 통합 및 기타 사전 빌드 IBM 도구 덕분에 Watson 음성 인식 서비스는 기본 전사 이상의 기능을 수행합니다. 예를 들어 고객 서비스 컨텍스트에서 사용하려는 경우 자연어 질문을 직접 처리하거나 전화를 통해 쿼리에 응답하도록 Watson Assistant를 설정할 수 있습니다..

Watson에서 IBM은 기능이 풍부한 자연어 처리 플랫폼을 구성했습니다. (이미지 크레디트 : IBM)

Watson은 11 개 언어의 라이브 오디오와 함께 작동하며 다양한 사전 녹음 된 형식으로 사운드를 가져올 수 있습니다. 스트리밍 할 때 실시간 진단 지원을 통해 Watson은 사용자에게 마이크에 더 가까이 이동하거나 환경을 변경하라는 메시지를 표시 할 수 있습니다. 또한 베타 테스트를 진행중인 스피커 디어 라이 제이션 덕분에 Watson이 공유 대화에서 다른 스피커를 구별 할 수 있다는 사실도 인상적입니다..

Watson Speech to Text : 설정

Watson을 사용하려면 가장 먼저 IBM Bluemix 계정을 작성해야합니다. 이메일 주소와 비밀번호 만 있으면 무료로 간편하게 등록 할 수 있습니다. 로그인하면 Speech to Text 서비스를 위해 계정에 규정을 추가해야합니다. 이 단계에서 자신의 기록에 저장해야하는 몇 가지 자격 증명이 제공됩니다..

Watson의 전체 기능 세트에 액세스하려면 IBM Bluemix 계정을 등록해야합니다. (이미지 크레디트 : IBM)

그렇게하면 상황이 훨씬 더 복잡해집니다. Watson에 액세스하려면 해당 자격 증명을 클라이언트의 URL (클라이언트 리소스 로케이터) 코드에 추가 한 다음 컴퓨터에서 실행해야합니다. 어떤 명령을 호출해야하는지 알아 보려면이 편리한 안내서를 확인하십시오. 또는 모든 후프를 뛰어 넘지 않고 Watson 시스템이 얼마나 잘 작동하는지 보려면 IBM 데모 사이트에서 대신 사용해 볼 수 있습니다.

Watson Speech to Text : 인터페이스

소비자 용 음성 텍스트 응용 프로그램과 달리 Watson의 서비스는 다른 시스템에 포함 된 API 및 코드를 통해 액세스 할 수 있도록 설계되었습니다. 이런 이유로 실제 왓슨은 없습니다 “상호 작용”. 대신 Watson은 세 가지 다른 인터넷 프로토콜을 통해 액세스 할 수 있습니다. 이들은 WebSockets, REST API 및 Watson Developer Cloud입니다..

Watson Speech to Text는 Watson Developer Cloud 시스템을 통해 관리 할 수 ​​있습니다. (이미지 크레디트 : IBM)

Watson을 제어하려면이 세 가지 경로 중 하나를 통해 IBM 클라우드에 연결하는 명령 행 도구를 사용해야합니다. Watson과 상호 작용하는 최종 사용자가 보는 인터페이스는 개발 팀의 누군가가 별도로 빌드해야합니다..

Watson Speech to Text : 성능

우리는이 자연 언어 처리 플랫폼이 실제 연설을 처리하는 방식에 깊은 인상을 받았습니다. Watson을 사용하여 다양한 까다로운 환경에서 녹음 한 클립과 Watson의 11 개 지원 언어 중 몇 가지 유명한 연설을 녹음했습니다..

우리는 Watson이 사전 녹음 된 연설로 잘 수행 한 것을 발견했습니다. (이미지 크레디트 : IBM)

배경 노이즈가 많은 클립의 경우 오류가 더 자주 발생하지만 일반적으로 Watson은 매우 정확한 결과를 생성했습니다. 테스트에서 무단 실수는 평균 150 단어마다 한 번만 발생했다고 추정했습니다. 그러나 왓슨의 스피커 디어 라이 제이션 기능이 베타 테스트에 남아있는 이유가 명확 해졌습니다. 평가 과정에서 한 번의 음성이 별도의 스피커로 잘못 분류되었습니다..

Watson Speech to Text : 지원

IBM 자원 센터는 Watson을 특정 유스 케이스에 적용하는 방법을보다 잘 이해하기 위해 많은 문서를 제공합니다. Watson 개발자 커뮤니티에서 작성하고 GitHub에 게시 한 API 통합 및 SDK를 활용할 가치가 있습니다..

Watson API GitHub 페이지는 Watson Speech to Text 서비스에 대한 훌륭한 지원 소스입니다. (이미지 크레디트 : IBM)

문제점에 대한 솔루션을 찾을 수없는 경우 지원 티켓을 열거 나 전화로 문의하여 IBM에 직접 문의 할 수 있습니다. 프리미엄 Watson 패키지 중 하나를 선택하면 서비스 사용 시간 계약에 따라 Watson 사용이 보호됩니다..

Watson Speech to Text : 최종 평결

조직에 IBM Watson Speech to Text 플랫폼을 시스템에 올바르게 통합 할 수있는 노하우와 자원이있는 경우 실시간 사운드 환경 진단 및 임시 전사 결과와 같은 고급 기능의 이점을 누릴 수 있습니다. 그러나 소규모 기업과 조직은 Watson을 올바르게 설정해야하는 기술적 문제로 어려움을 겪을 것입니다..

경쟁

IBM Watson Speech to Text 서비스는 Google Cloud Speech-to-Text 및 Amazon Transcribe 대량 전사 서비스와 직접 경쟁합니다. 예를 들어 분당 0.006 달러에서 시작하는 Google Cloud 녹음을 사용하면이 두 가지 모두 Watson보다 훨씬 저렴합니다. 세 가지 서비스는 모두 사용자 정의 어휘와 같은 유사한 기능을 공유하지만 IBM Watson에서 누락 된 기능은 있지만 두 경쟁사와 함께 사용할 수있는 기능은 자동 구두점 인식입니다..

또 다른 spoeech-to-text 솔루션을 찾고 계십니까? 최고의 음성 대 텍스트 소프트웨어 가이드를 확인하십시오..