CLOVA Speech 단문 인식 API
    • PDF

    CLOVA Speech 단문 인식 API

    • PDF

    Article Summary

    Classic/VPC 환경에서 이용 가능합니다.

    version

    VersionDateChanges
    v1.0.02023.11.23.최초 작성
    v1.0.12023.12.21.발음 평가(영어) 기능 추가

    요청

    MethodRequest URI
    POSTCLOVA Speech 도메인에서 생성된 API Gateway의 InvokeURL로 호출

    API URL

    MethodRequest URI
    POSThttps://clovaspeech-gw.ncloud.com/recog/v1/stt

    요청 헤더

    헤더명설명
    X-CLOVASPEECH-API-KEY{Secret Key}
    Content-Typeapplication/octet-stream

    Query Param

    namevaluerequiredvalue
    langstringtrueKor, Eng, Jpn, Chn
    assessmentboolfalse발음평가 결과를 반환할지 결정하는 파라미터(Eng only)
    utterancestringfalse발음 평가 대상 텍스트
    graphboolfalse음성파형을 반환할지 결정하는 파라미터
    • Assement는 영어(Eng) 선택 시 동작합니다.

    응답

    응답 바디

    Field NameTypeDescription
    textstring인식한 음원의 결괏값
    quotaint음원 길이(15초 단위)
    assessment_scoreint문장 전체의 발음 점수(0~100)
    ref_graphint array기준 발음에 대한 음성 파형의 값 배열(양의 정수, 초당 50 샘플)
    usr_graphint array입력 발음에 대한 음성 파형의 값 배열(양의 정수, 초당 50 샘플)

    Example (cURL shell)

    curl --location 'https://clovaspeech-gw.ncloud.com/recog/v1/stt?lang=Eng&assessment=true&graph=true' \
    --header 'X-CLOVASPEECH-API-KEY: ${secret key}' \
    --header 'Content-Type: application/octet-stream' \
    --data '@/D:/example.mp3'
    
    {
        "text": "sunday morning in an angry creditor",
        "quota": 15, "assessment_score": 14, "assessment_details": "false|{f(f):45, a(ɔː):100, l(l):97, se(s):43} ",
        "ref_graph": [
            0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 4, 6, 8, 10, 11, 13, 15, 17, 18, 20, 21, 21, 22, 21, 21, 21, 20, 20, 19, 18, 17, 15, 14, 12, 11, 9, 7, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
        ],
        "usr_graph": [
            0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 4, 6, 7, 9, 11, 13, 15, 16, 18, 19, 20, 21, 21, 21, 21, 20, 20, 19, 18, 17, 16, 15, 13, 12, 10, 8, 6, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
        ]
    }
    

    오류 코드

    {
        "timestamp": 1700536699045,
        "error": {
            "errorCode": "STT005",
            "message": "Invalid Language"
        }
    }
    

    API 오류

    HttpStatusCodeErrorCodeErrorMessageDescription
    400400-Invalid request parameters
    401401Invalid secretInvalid secret
    413STT001Exceed Sound Data length허용 음성데이터 길이 초과(60초)
    400STT002Invalid Content Typeapplication/octet-stream 이외의 content-type인 경우 발생
    400STT003Empty Sound Data음성 데이터가 입력되지 않음
    400STT005Invalid Language정해진 언어 이외의 언어 값이 입력됨
    400STT004Empty Language언어 파라미터가 입력되지 않음
    500STT006Failed to pre-processing음성 인식 전처리 중 오류 발생 음성 데이터가 정상적인 wav, mp3, flac인지 확인 필요
    500STT998Failed to STT음성 인식 중 오류 발생(고객지원을 통해 문의하면 신속히 조치 가능)
    500STT999Internal Server Error알 수 없는 오류 발생(고객지원을 통해 문의하면 신속히 조치 가능)

    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.