CLOVA Speech短文認識 API
- 印刷する
- PDF
CLOVA Speech短文認識 API
- 印刷する
- PDF
記事の要約
この要約は役に立ちましたか?
ご意見ありがとうございます
Classic/VPC環境で利用できます。
version
Version | Date | Changes |
---|---|---|
v1.0.0 | 2023.11.23. | 最初の作成 |
v1.0.1 | 2023.12.21. | 発音評価(英語)機能を追加 |
リクエスト
Method | Request URI |
---|---|
POST | CLOVA Speechドメインで作成された API Gatewayの InvokeURLで呼び出す |
API URL
Method | Request URI |
---|---|
POST | https://clovaspeech-gw.ncloud.com/recog/v1/stt |
リクエストヘッダ
ヘッダ名 | 説明 |
---|---|
X-CLOVASPEECH-API-KEY | {Secret Key} |
Content-Type | application/octet-stream |
Query Param
name | value | required | value |
---|---|---|---|
lang | string | true | Kor, Eng, Jpn, Chn |
assessment | bool | false | 発音評価の結果を返すかどうかを決めるパラメータ(Eng only) |
utterance | string | false | 発音評価対象のテキスト |
graph | bool | false | 音声波形を返すかどうかを決めるパラメータ |
- Assementは、英語(Eng)を選択すると動作します。
レスポンス
レスポンスボディ
Field Name | Type | Description |
---|---|---|
text | string | 認識した音源の結果 |
quota | int | 音源の長さ(15秒単位) |
assessment_score | int | センテンス全体の発音スコア(0~100) |
ref_graph | int array | 基準発音に対する音声波形の値配列(正の整数、1秒当たり50サンプル) |
usr_graph | int array | 入力発音に対する音声波形の値配列(正の整数、1秒当たり50サンプル) |
Example (cURL shell)
エラーコード
APIエラー
HttpStatusCode | ErrorCode | ErrorMessage | Description |
---|---|---|---|
400 | 400 | - | Invalid request parameters |
401 | 401 | Invalid secret | Invalid secret |
413 | STT001 | Exceed Sound Data length | 音声データの最大長さを超過(60秒) |
400 | STT002 | Invalid Content Type | application/octet-stream以外の content-typeの場合に発生 |
400 | STT003 | Empty Sound Data | 音声データが入力されていない |
400 | STT005 | Invalid Language | 決められた言語以外の言語が入力される |
400 | STT004 | Empty Language | 音声パラメータが入力されていない |
500 | STT006 | Failed to pre-processing | 音声認識前処理中にエラーが発生 音声データが正常な wav、mp3、flacであるかどうか確認が必要 |
500 | STT998 | Failed to STT | 音声認識中にエラー発生(カスタマーサポートまで連絡すると速やかに対応) |
500 | STT999 | Internal Server Error | 不明なエラー発生(カスタマーサポートまで連絡すると速やかに対応) |
この記事は役に立ちましたか?