CLOVA Speechの概要
- 印刷する
- PDF
CLOVA Speechの概要
- 印刷する
- PDF
記事の要約
この要約は役に立ちましたか?
ご意見ありがとうございます
Classic/VPC環境で利用できます。
CLOVA Speechは、CLOVAの NEST(Neural End-to-end Speech Transcriber)音声認識技術を通じて、簡単かつスピーディーに音声認識サービスを提供する NAVERクラウドプラットフォームのサービスです。長いオーディオ/ビデオファイルのテキスト変換、音声メモ、動画字幕の生成、通話録音の管理など、音声ベースの機能関連の APIを RESTful形式で提供します。
参考
CLOVA Speechサービスは、長いオーディオ/ビデオファイルをアップロードして音声認識結果を確認できます。一方、CLOVA Speech Recognition(CSR)サービスは、1分以内の命令型音声の認識に最適化されています。
CLOVA Speechの共通設定
CLOVA Speech APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。
リクエスト
共通リクエスト形式を説明します。
API URL
リクエスト API URLは次の通りです。
CLOVA Speechドメインで作成された API Gatewayの固有の InvokeURL
参考
InvokeURLの確認方法の詳細は、CLOVA Speechご利用ガイドをご参照ください。
リクエストヘッダ
ヘッダの説明は次の通りです。
フィールド | 必須の有無 | 説明 |
---|---|---|
Content-Type | Required | リクエストデータの形式
|
レスポンス
共通レスポンス形式を説明します。
レスポンスステータスコード
レスポンスステータスコードの説明は次の通りです。
参考
NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。
HTTPステータスコード | コード | トーク | 説明 |
---|---|---|---|
400 | 400 | Invalid request parameters | 入力したリクエストパラメータが無効である |
401 | 401 | Invalid secret | 入力した Secret Keyが無効である |
400 | STT002 | Invalid Content Type | application/octet-stream 以外のContent-Type が入力される |
400 | STT003 | Empty Sound Data | 音声データ漏れ |
400 | STT005 | Invalid Language | 入力された言語(lang )パラメータをサポートしない |
400 | STT004 | Empty Language | 言語(lang )パラメータ漏れ |
413 | STT001 | Exceed Sound Data length | 入力されたが音声データが最大長さを超過(60秒) |
500 | STT006 | Failed to pre-processing | 音声認識前処理中にエラーが発生
|
500 | STT998 | Failed to STT | 音声認識中にエラー発生
|
500 | STT999 | Internal Server Error | 内部サーバエラー
|
- | - | SUCCEEDED | 処理成功 |
- | - | PROCESSING | 処理中 |
- | - | ERROR_SERVER_BUSY | 余分のサーバリソースがない |
- | - | ERROR_TOKEN_INVALID | トークンが存在しない |
- | - | ERROR_AUDIO_EMPTY | 音声データが存在しない |
- | - | ERROR_AUDIO_CONVERSION | 音声変換失敗 |
- | - | ERROR_PARAMS_FORMAT_INVALID | 入力したパラメータ形式が JSONではない |
- | - | ERROR_REQUEST_PARAMETER | 入力したリクエストパラメータが無効である |
- | - | ERROR_REQUEST_PARAMETER | 話者が認識できない |
- | - | ERROR_INVALID_SECRET | 入力した Secret Keyが無効である |
- | - | ERROR_DATA_NOT_FOUND | サーバ内部エラー |
- | - | ERROR_DATA_CONFLICT | データクラッシュ |
- | - | ERROR_INTERNAL_ERROR | サーバ内部エラー |
- | - | ERROR_EXTERNAL_ERROR | サービス失敗 |
- | - | ERROR_TOO_MANY_JOBS | 処理量超過 |
- | - | ERROR_GATEWAY_TIMEOUT | タイムオーバー |
- | - | FAILED | その他のエラー |
CLOVA Speech API
CLOVA Speechサービスで提供する APIの説明は次の通りです。
API | 説明 |
---|---|
長文認識 > Object Storageファイルの認識 | NAVERクラウドプラットフォームの Object Storageに保存されているメディアファイルの固有の URLで長文を認識 |
長文認識 > 外部ファイルの認識 | 公開されている音声ファイルの固有の URLで長文を認識 |
長文認識 > ローカルファイルの認識 | ローカルファイルの長文を認識 |
長文認識 > 処理状態の確認 | 非同期(async)方式の処理状態を確認 |
短文認識 | 最大60秒の短い音声ファイルを認識 |
リアルタイムストリーミングの認識 | リアルタイム音声認識とテキスト変換 |
CLOVA Speech関連リソース
CLOVA Speech APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。
- CLOVA Speech APIの使用方法
- Ncloudの共通レスポンスステータスコード: CLOVA Speechサービスで使用される NAVERクラウドプラットフォームの共通レスポンスステータスコード情報
- Object Storageご利用ガイド: CLOVA Speechの利用に必要な Object Storageの使用方法
- Sub Accountご利用ガイド: CLOVA Speechの運用権限管理をサポートする Sub Accountの使用方法
- CLOVA Speechサービスの使用方法
- CLOVA Speechご利用ガイド: NAVERクラウドプラットフォームコンソールでの CLOVA Speechサービス利用関連の案内、使用量の確認と通知設定の方法
- CLOVA Speechを使用する前に: CLOVA Speechを利用するためのサポートスペック、サポートするファイル形式、利用料金の案内
- Ncloud使用環境ガイド: VPC、Classic環境とサポートの有無に関するご利用ガイド
- 料金の紹介、特徴、詳細機能: CLOVA Speechの料金体系、CLOVA Speechの特徴と詳細機能のサマリー
- サービス関連の最新のお知らせ: CLOVA Speech関連の最新共有ニュース
- よくある質問: CLOVA Speechユーザーからのよくある質問
- お問い合わせ: ご利用ガイドだけでは不明な点が解消されない場合、直接お問い合わせ
この記事は役に立ちましたか?