Classic/VPC環境で利用できます。
version
Version | Date | Changes |
---|
v1.0.0 | 2023.11.23. | 最初の作成 |
v1.0.1 | 2023.12.21. | 発音評価(英語)機能を追加 |
リクエスト
Method | Request URI |
---|
POST | CLOVA Speechドメインで作成された API Gatewayの InvokeURLで呼び出す |
API URL
Method | Request URI |
---|
POST | https://clovaspeech-gw.ncloud.com/recog/v1/stt |
リクエストヘッダ
ヘッダ名 | 説明 |
---|
X-CLOVASPEECH-API-KEY | {Secret Key} |
Content-Type | application/octet-stream |
Query Param
name | value | required | value |
---|
lang | string | true | Kor, Eng, Jpn, Chn |
assessment | bool | false | 発音評価の結果を返すかどうかを決めるパラメータ(Eng only) |
utterance | string | false | 発音評価対象のテキスト |
graph | bool | false | 音声波形を返すかどうかを決めるパラメータ |
- Assementは、英語(Eng)を選択すると動作します。
レスポンス
レスポンスボディ
Field Name | Type | Description |
---|
text | string | 認識した音源の結果 |
quota | int | 音源の長さ(15秒単位) |
assessment_score | int | センテンス全体の発音スコア(0~100) |
ref_graph | int array | 基準発音に対する音声波形の値配列(正の整数、1秒当たり50サンプル) |
usr_graph | int array | 入力発音に対する音声波形の値配列(正の整数、1秒当たり50サンプル) |
Example (cURL shell)
curl --location 'https://clovaspeech-gw.ncloud.com/recog/v1/stt?lang=Eng&assessment=true&graph=true' \
--header 'X-CLOVASPEECH-API-KEY: ${secret key}' \
--header 'Content-Type: application/octet-stream' \
--data '@/D:/example.mp3'
{
"text": "sunday morning in an angry creditor",
"quota": 15, "assessment_score": 14, "assessment_details": "false|{f(f):45, a(ɔː):100, l(l):97, se(s):43} ",
"ref_graph": [
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 4, 6, 8, 10, 11, 13, 15, 17, 18, 20, 21, 21, 22, 21, 21, 21, 20, 20, 19, 18, 17, 15, 14, 12, 11, 9, 7, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
],
"usr_graph": [
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 4, 6, 7, 9, 11, 13, 15, 16, 18, 19, 20, 21, 21, 21, 21, 20, 20, 19, 18, 17, 16, 15, 13, 12, 10, 8, 6, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
]
}
エラーコード
{
"timestamp": 1700536699045,
"error": {
"errorCode": "STT005",
"message": "Invalid Language"
}
}
APIエラー
HttpStatusCode | ErrorCode | ErrorMessage | Description |
---|
400 | 400 | - | Invalid request parameters |
401 | 401 | Invalid secret | Invalid secret |
413 | STT001 | Exceed Sound Data length | 音声データの最大長さを超過(60秒) |
400 | STT002 | Invalid Content Type | application/octet-stream以外の content-typeの場合に発生 |
400 | STT003 | Empty Sound Data | 音声データが入力されていない |
400 | STT005 | Invalid Language | 決められた言語以外の言語が入力される |
400 | STT004 | Empty Language | 音声パラメータが入力されていない |
500 | STT006 | Failed to pre-processing | 音声認識前処理中にエラーが発生 音声データが正常な wav、mp3、flacであるかどうか確認が必要 |
500 | STT998 | Failed to STT | 音声認識中にエラー発生(カスタマーサポートまで連絡すると速やかに対応) |
500 | STT999 | Internal Server Error | 不明なエラー発生(カスタマーサポートまで連絡すると速やかに対応) |
あなたのフィードバックをありがとう!私たちのチームはあなたに戻って取得します