CLOVA Speech Recognition (CSR) 개요
    • PDF

    CLOVA Speech Recognition (CSR) 개요

    • PDF

    기사 요약

    Classic/VPC 환경에서 이용 가능합니다.

    CLOVA Speech Recognition은 사람의 목소리를 텍스트로 변환하는 네이버 클라우드 플랫폼의 서비스입니다. CLOVA Speech Recognition 서비스에서는 비서 애플리케이션, 챗봇, 음성 메모 등에 활용하는 다양한 음성 인식 기능에 대한 API를 RESTful 형태로 제공합니다. 모바일 환경에서는 사용자의 음성 입력을 전달받기 위해 Android와 iOS SDK 형태로 API를 제공합니다.

    참고

    CLOVA Speech는 길이가 긴 오디오/비디오 파일을 업로드하여 해당 오디오/비디오 파일의 음성 인식 결과를 확인할 수 있습니다. 반면, CSR (CLOVA Speech Recognition) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.

    CLOVA Speech Recognition (CSR) 공통 설정

    CLOVA Speech Recognition API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.

    요청

    공통 요청 형식을 설명합니다.

    API URL

    요청 API URL은 다음과 같습니다.

    https://naveropenapi.apigw.ntruss.com/recog/v1
    
    참고

    모바일 환경에서 플랫폼별로 API를 사용하는 방법은 Mobile SDK 문서를 참조해 주십시오.

    요청 헤더

    요청 헤더에 대한 설명은 다음과 같습니다.

    필드필수 여부설명
    x-ncp-apigw-api-key-idRequired네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client ID
    x-ncp-apigw-api-keyRequired네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client Secret
    Content-TypeRequired요청 데이터의 형식
    • application/octet-stream
    참고

    네이버 클라우드 플랫폼 콘솔에서 Application을 등록하여 API 사용에 필요한 인증 정보(Client ID, Client Secret)를 발급받는 방법은 CLOVA Speech Recognition (CSR) 사용 가이드를 참조해 주십시오.
    콘솔에서 Application 등록 후 사용할 API가 선택되어 있는지 [수정] 버튼을 클릭하여 확인해 주십시오. 선택되어 있지 않으면 429 (Quota Exceed) 오류가 발생합니다.

    응답

    공통 응답 형식을 설명합니다.

    응답 상태 코드

    응답 상태 코드에 대한 설명은 다음과 같습니다.

    • STT (Speech-to-Text)
    HTTP 상태 코드코드메시지설명
    413STT000Request Entity Too Large입력한 음성 데이터 값이 허용 용량 초과(최대 3 MB)
    413STT001Exceed Sound Data length입력한 음성 데이터 값이 허용 길이 초과(최대 60 초)
    400STT002Invalid Content Typeapplication/octet-stream 이외의 Content-Type이 입력됨
    400STT003Empty Sound Data음성 데이터가 입력되지 않음
    400STT004Empty Language언어(lang) 파라미터가 입력되지 않음
    400STT005Invalid Language입력된 언어(lang) 파라미터를 지원하지 않음
    500STT006Failed to pre-processing음성 인식 전처리 중 오류 발생
    • 음성 데이터가 정상적인 wav, mp3, flac 파일인지 확인 필요
    400STT007Too Short Sound Data음성 데이터 길이가 짧음(400 ms 이하)
    500STT998Failed to STT음성 인식 중 오류 발생
    • 고객지원 문의
    500STT999Internal Server Error내부 서버 오류
    • 고객지원 문의
    • Mobile SDK
    HTTP 상태 코드코드메시지설명
    -10ERROR_NETWORK_INITIALIZE네트워크 자원 초기화 시 오류 발생
    -11ERROR_NETWORK_FINALIZE네트워크 자원 해제 시 오류 발생
    -12ERROR_NETWORK_READ네트워크 데이터 수신 시 오류 발생
    • 클라이언트 기기의 네트워크 환경이 느려서 타임아웃 발생
    -13ERROR_NETWORK_WRITE네트워크 데이터 전송 시 오류 발생
    • 클라이언트 기기의 네트워크 환경이 느려서 타임아웃 발생
    -14ERROR_NETWORK_NACK음성 인식 서버에서 오류 발생
    • 클라이언트 기기의 네트워크 환경이 느려서 음성 패킷을 서버에 제시간에 보내지 못해 타임아웃 발생
    -15ERROR_INVALID_PACKET유효하지 않은 패킷을 전송하여 오류 발생
    -20ERROR_AUDIO_INITIALIZE오디오 자원 초기화 시 오류 발생
    • 오디오 사용 권한 여부 확인 요망
    -21ERROR_AUDIO_FINALIZE오디오 자원 해제 시 오류 발생
    -22ERROR_AUDIO_RECORD음성 입력(녹음) 시 오류 발생
    • 오디오 사용 권한 여부 확인 요망
    -30ERROR_SECURITY인증 권한 오류
    -40ERROR_INVALID_RESULT인식 결과 오류
    -41ERROR_TIMEOUT일정 시간 이상 서버로 음성을 전송하지 못하거나 인식 결과를 받지 못함
    -42ERROR_NO_CLIENT_RUNNING클라이언트가 음성 인식을 수행하지 않는 상황에서 특정 음성 인식 관련 이벤트 감지
    -50ERROR_UNKNOWN_EVENT클라이언트 내부에 규정되어 있지 않은 이벤트 감지
    -60ERROR_VERSION프로토콜 버전 오류
    -61ERROR_CLIENTINFO클라이언트 정보 오류
    -62ERROR_SERVER_POOL음성 인식 가용 서버가 부족함
    -63ERROR_SESSION_EXPIRED음성 인식 서버 세션 만료
    -64ERROR_SPEECH_SIZE_EXCEEDED음성 패킷 사이즈 초과
    -65ERROR_EXCEED_TIME_LIMIT인증용 타임스탬프에서 오류 발생
    -66ERROR_WRONG_SERVICE_TYPE올바른 서비스 타입(Service Type)이 아님
    -67ERROR_WRONG_LANGUAGE_TYPE올바른 언어 타입(Language Type)이 아님
    -70ERROR_OPENAPI_AUTHOpen API 인증 시 오류 발생
    • Client ID와 등록된 Package 이름(Android) 또는 Bundle ID 정보(iOS)가 잘못됨
    -71ERROR_QUOTA_OVERFLOW정해진 API 호출 제한량(Quota) 소진
    • 기타 오류 및 문의
    현상 또는 문의원인 또는 해결 방법
    UnsatifiedLinkError 오류 발생
    • CSR API는 armeabi와 armeabi-v7a로 빌드된 라이브러리 제공
    • 개발 중인 앱에서 사용하는 라이브러리 중 armeabi와 armeabi-v7a를 지원하지 않는 것이 있다면 해당 오류 발생 가능
    android fatal signal 11 (sigsegv) 오류 발생
    • CSR API를 사용하여 음성을 입력받기 전 사전에 자원을 준비해야 함
    • recognize() 호출 전 initialize(), release() 가 잘 호출되는지 확인
    인식 결과로 ""(null)이 반환
    • 사용자가 매우 작은 목소리로 발성하였거나, 주변 소리로 인해 목소리가 인식되지 않았을 경우 발생 가능
    • 극히 드물게 발생하지만 인식 결과가 null(빈 값)일 때도 예외 처리해주는 것을 권장
    오디오 파일 인식CSR API는 오디오 파일 인식 미지원
    저사양 스마트폰에서 정상 작동하지 않음Android SDK 버전 10 이상, iOS 버전 8 이상의 기기 지원
    참고

    네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.

    CLOVA Speech Recognition API

    CLOVA Speech Recognition 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.

    API설명
    STT (Speech-to-Text)음성 텍스트 추출
    Mobile SDK모바일 환경에서 음성 텍스트 추출

    CLOVA Speech Recognition 연관 리소스

    CLOVA Speech Recognition API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.


    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.