CLOVA Speech 개요
    • PDF

    CLOVA Speech 개요

    • PDF

    기사 요약

    Classic/VPC 환경에서 이용 가능합니다.

    CLOVA Speech는 CLOVA의 NEST(Neural End-to-end Speech Transcriber) 음성 인식 기술을 통해 빠르고 쉬운 음성 인식 서비스를 제공하는 네이버 클라우드 플랫폼의 서비스입니다. 길이가 긴 오디오/비디오 파일의 텍스트 변환, 음성 메모, 영상 자막 생성, 통화 녹취록 관리 등 음성 기반 기능에 대한 API를 RESTful 형태로 제공합니다.

    참고

    CLOVA Speech 서비스는 길이가 긴 오디오/비디오 파일을 업로드하여 음성 인식 결과를 확인할 수 있습니다. 반면, CLOVA Speech Recognition(CSR) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.

    CLOVA Speech 공통 설정

    CLOVA Speech API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.

    요청

    공통 요청 형식을 설명합니다.

    API URL

    요청 API URL은 다음과 같습니다.

    CLOVA Speech 도메인에서 생성된 API Gateway의 고유 InvokeURL
    
    참고

    InvokeURL을 확인하는 방법은 CLOVA Speech 사용 가이드를 참조해 주십시오.

    요청 헤더

    헤더에 대한 설명은 다음과 같습니다.

    필드필수 여부설명
    Content-TypeRequired요청 데이터의 형식
    • application/json | multipart/form-data | application/octet-stream

    응답

    공통 응답 형식을 설명합니다.

    응답 상태 코드

    응답 상태 코드에 대한 설명은 다음과 같습니다.

    참고

    네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.

    HTTP 상태 코드코드메시지설명
    400400Invalid request parameters입력한 요청 파라미터 값이 올바르지 않음
    401401Invalid secret입력한 Secret Key 값이 올바르지 않음
    400STT002Invalid Content Typeapplication/octet-stream 이외의 Content-Type이 입력됨
    400STT003Empty Sound Data음성 데이터 누락
    400STT005Invalid Language입력된 언어(lang) 파라미터를 지원하지 않음
    400STT004Empty Language언어(lang) 파라미터 누락
    413STT001Exceed Sound Data length입력된 음성 데이터 값이 허용 길이를 초과 (60초)
    500STT006Failed to pre-processing음성 인식 전처리 중 오류 발생
    • 음성 데이터가 정상적인 wav, mp3, flac 인지 확인 필요
    500STT998Failed to STT음성 인식 중 오류가 발생함
    • 고객 지원 문의 필요
    500STT999Internal Server Error내부 서버 오류
    • 고객 지원 문의 필요
    --SUCCEEDED작업 성공
    --PROCESSING작업 진행 중
    --ERROR_SERVER_BUSY서버 여유 자원이 없음
    --ERROR_TOKEN_INVALID토큰이 존재하지 않음
    --ERROR_AUDIO_EMPTY음성 데이터 값이 존재하지 않음
    --ERROR_AUDIO_CONVERSION음성 변환 실패
    --ERROR_PARAMS_FORMAT_INVALID입력한 파라미터 형식이 JSON이 아님
    --ERROR_REQUEST_PARAMETER입력한 요청 파라미터가 올바르지 않음
    --ERROR_REQUEST_PARAMETER화자가 인식되지 않음
    --ERROR_INVALID_SECRET입력한 Secret Key 값이 올바르지 않음
    --ERROR_DATA_NOT_FOUND서버 내부 오류
    --ERROR_DATA_CONFLICT데이터 충돌
    --ERROR_INTERNAL_ERROR서버 내부 오류
    --ERROR_EXTERNAL_ERROR서비스 작동 불가능
    --ERROR_TOO_MANY_JOBS작업량 초과
    --ERROR_GATEWAY_TIMEOUT시간 초과
    --FAILED기타 오류

    CLOVA Speech API

    CLOVA Speech 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.

    API설명
    장문 인식 > Object Storage 파일 인식네이버 클라우드 플랫폼의 Object Storage에 저장되어 있는 미디어 파일의 고유 URL로 장문 인식
    장문 인식 > 외부 파일 인식공개되어 있는 음성 파일의 고유 URL로 장문 인식
    장문 인식 > 로컬 파일 인식로컬 파일에 대해 장문 인식
    장문 인식 > 작업 상태 확인비동기(async) 방식의 작업 상태 확인
    단문 인식최대 60초 길이의 짧은 음성 파일 인식
    실시간 스트리밍 인식실시간 음성 인식 및 텍스트 변환

    CLOVA Speech 연관 리소스

    CLOVA Speech API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.


    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.