CLOVA Speech短文認識の API
    • PDF

    CLOVA Speech短文認識の API

    • PDF

    Article Summary

    最新のコンテンツが反映されていません。早急にアップデート内容をご提供できるよう努めております。最新のコンテンツ内容は韓国語ページをご参照ください。

    Classic/VPC環境で利用できます。

    version

    VersionDateChanges
    v1.0.02023.11.23.初回作成
    v1.0.12023.12.21.発音評価(英語)機能を追加

    リクエスト

    MethodRequest URI
    POSTCLOVA Speechドメインで作成された API Gatewayの InvokeURLで呼び出し
    各ドメインごとに固有の呼び出し URLを作成

    API URL

    MethodRequest URI
    POSThttps://clovaspeech-gw.ncloud.com/recog/v1/stt

    リクエストヘッダ

    ヘッダ名説明
    X-CLOVASPEECH-API-KEY{Secret Key}
    Content-Typeapplication/octet-stream

    Query Param

    namevaluerequiredvalue
    langstringtrueKor, Eng, Jpn, Chn
    assessmentboolfalse発音評価結果を返すかを決めるパラメータ(Eng only)
    utterancestringfalse発音評価対象テキスト
    graphboolfalse音声波形を返すかを決めるパラメータ
    • Assessmentは英語(Eng)選択時に動作します。

    レスポンス

    レスポンスボディ

    Field NameTypeDescription
    textstring認識した音源の結果値
    quotaint音源の長さ(15秒単位)
    assessment_scoreint文章全体の発音スコア(0~100)
    ref_graphint array基準発音に対する音声波形値の配列(正の整数、毎秒50サンプル)
    usr_graphint array入力発音に対する音声波形値の配列(正の整数、毎秒50サンプル)

    Example (cURL shell)

    curl --location 'https://clovaspeech-gw.ncloud.com/recog/v1/stt?lang=Eng&assessment=true&graph=true' \
    --header 'X-CLOVASPEECH-API-KEY: ${secret key}' \
    --header 'Content-Type: application/octet-stream' \
    --data '@/D:/example.mp3'
    
    {
        "text": "sunday morning in an angry creditor",
        "quota": 15, "assessment_score": 14, "assessment_details": "false|{f(f):45, a(ɔː):100, l(l):97, se(s):43} ",
        "ref_graph": [
            0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 4, 6, 8, 10, 11, 13, 15, 17, 18, 20, 21, 21, 22, 21, 21, 21, 20, 20, 19, 18, 17, 15, 14, 12, 11, 9, 7, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
        ],
        "usr_graph": [
            0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 4, 6, 7, 9, 11, 13, 15, 16, 18, 19, 20, 21, 21, 21, 21, 20, 20, 19, 18, 17, 16, 15, 13, 12, 10, 8, 6, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
        ]
    }
    

    エラーコード

    {
        "timestamp": 1700536699045,
        "error": {
            "errorCode": "STT005",
            "message": "Invalid Language"
        }
    }
    

    APIのエラー

    HttpStatusCodeErrorCodeErrorMessageDescription
    400400-Invalid request parameters
    401401Invalid secretInvalid secret
    413STT001Exceed Sound Data length許容音声データ長を超過(60秒)
    400STT002Invalid Content Typeapplication/octet-stream以外の content-typeである場合に発生
    400STT003Empty Sound Data音声データが入力されていない
    400STT005Invalid Language定められた言語以外の言語値が入力される
    400STT004Empty Language言語パラメータが入力されていない
    500STT006Failed to pre-processing音声認識前処理中にエラー発生、音声データが正常な wav、mp3、flacであるか確認が必要
    500STT998Failed to STT音声認識中にエラー発生(カスタマーサポートに問い合わせると、迅速に対応可能)
    500STT999Internal Server Error不明なエラー発生(カスタマーサポートに問い合わせると、迅速に対応可能)

    この記事は役に立ちましたか?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.