CLOVA Speechの概要

Prev Next

Classic/VPC環境で利用できます。

CLOVA Speechは、CLOVAの NEST(Neural End-to-end Speech Transcriber)音声認識技術を通じて、簡単かつスピーディーに音声認識サービスを提供する NAVERクラウドプラットフォームのサービスです。長いオーディオ/ビデオファイルのテキスト変換、音声メモ、動画字幕の生成、通話録音の管理など、音声ベースの機能関連の APIを RESTful形式で提供します。

参考

CLOVA Speechサービスは、長いオーディオ/ビデオファイルをアップロードして音声認識結果を確認できます。一方、CLOVA Speech Recognition(CSR)サービスは、1分以内の命令型音声の認識に最適化されています。

CLOVA Speechの共通設定

CLOVA Speech APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。

リクエスト

共通リクエスト形式を説明します。

API URL

リクエスト API URLは次の通りです。

CLOVA Speechドメインで作成された API Gatewayの固有の InvokeURL
参考

InvokeURLの確認方法の詳細は、CLOVA Speechご利用ガイドをご参照ください。

リクエストヘッダ

ヘッダの説明は次の通りです。

フィールド 必須の有無 説明
Content-Type Required リクエストデータの形式
  • application/json | multipart/form-data | application/octet-stream

レスポンス

共通レスポンス形式を説明します。

レスポンスステータスコード

レスポンスステータスコードの説明は次の通りです。

参考

NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。

HTTPステータスコード コード トーク 説明
400 400 Invalid request parameters 入力したリクエストパラメータが無効である
401 401 Invalid secret 入力した Secret Keyが無効である
400 STT002 Invalid Content Type application/octet-stream以外のContent-Typeが入力される
400 STT003 Empty Sound Data 音声データ漏れ
400 STT005 Invalid Language 入力された言語(lang)パラメータをサポートしない
400 STT004 Empty Language 言語(lang)パラメータ漏れ
413 STT001 Exceed Sound Data length 入力されたが音声データが最大長さを超過(60秒)
500 STT006 Failed to pre-processing 音声認識前処理中にエラーが発生
  • 音声データが正常なwavmp3flacであるかどうか確認が必要
500 STT998 Failed to STT 音声認識中にエラー発生
  • カスタマーサポートに問い合わせる
500 STT999 Internal Server Error 内部サーバエラー
  • カスタマーサポートに問い合わせる
- - SUCCEEDED 処理成功
- - PROCESSING 処理中
- - ERROR_SERVER_BUSY 余分のサーバリソースがない
- - ERROR_TOKEN_INVALID トークンが存在しない
- - ERROR_AUDIO_EMPTY 音声データが存在しない
- - ERROR_AUDIO_CONVERSION 音声変換失敗
- - ERROR_PARAMS_FORMAT_INVALID 入力したパラメータ形式が JSONではない
- - ERROR_REQUEST_PARAMETER 入力したリクエストパラメータが無効である
- - ERROR_REQUEST_PARAMETER 話者が認識できない
- - ERROR_INVALID_SECRET 入力した Secret Keyが無効である
- - ERROR_DATA_NOT_FOUND サーバ内部エラー
- - ERROR_DATA_CONFLICT データクラッシュ
- - ERROR_INTERNAL_ERROR サーバ内部エラー
- - ERROR_EXTERNAL_ERROR サービス失敗
- - ERROR_TOO_MANY_JOBS 処理量超過
- - ERROR_GATEWAY_TIMEOUT タイムオーバー
- - FAILED その他のエラー

CLOVA Speech API

CLOVA Speechサービスで提供する APIの説明は次の通りです。

API 説明
長文認識 > Object Storageファイルの認識 NAVERクラウドプラットフォームの Object Storageに保存されているメディアファイルの固有の URLで長文を認識
長文認識 > 外部ファイルの認識 公開されている音声ファイルの固有の URLで長文を認識
長文認識 > ローカルファイルの認識 ローカルファイルの長文を認識
長文認識 > 処理状態の確認 非同期(async)方式の処理状態を確認
短文認識 最大60秒の短い音声ファイルを認識
リアルタイムストリーミングの認識 リアルタイム音声認識とテキスト変換

CLOVA Speech関連リソース

CLOVA Speech APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。