CLOVA Speechの概要
    • PDF

    CLOVA Speechの概要

    • PDF

    記事の要約

    Classic/VPC環境で利用できます。

    CLOVA Speechは、CLOVAの NEST(Neural End-to-end Speech Transcriber)音声認識技術を通じて、簡単かつスピーディーに音声認識サービスを提供する NAVERクラウドプラットフォームのサービスです。長いオーディオ/ビデオファイルのテキスト変換、音声メモ、動画字幕の生成、通話録音の管理など、音声ベースの機能関連の APIを RESTful形式で提供します。

    参考

    CLOVA Speechサービスは、長いオーディオ/ビデオファイルをアップロードして音声認識結果を確認できます。一方、CLOVA Speech Recognition(CSR)サービスは、1分以内の命令型音声の認識に最適化されています。

    CLOVA Speechの共通設定

    CLOVA Speech APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。

    リクエスト

    共通リクエスト形式を説明します。

    API URL

    リクエスト API URLは次の通りです。

    CLOVA Speechドメインで作成された API Gatewayの固有の InvokeURL
    
    参考

    InvokeURLの確認方法の詳細は、CLOVA Speechご利用ガイドをご参照ください。

    リクエストヘッダ

    ヘッダの説明は次の通りです。

    フィールド必須の有無説明
    Content-TypeRequiredリクエストデータの形式
    • application/json | multipart/form-data | application/octet-stream

    レスポンス

    共通レスポンス形式を説明します。

    レスポンスステータスコード

    レスポンスステータスコードの説明は次の通りです。

    参考

    NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。

    HTTPステータスコードコードトーク説明
    400400Invalid request parameters入力したリクエストパラメータが無効である
    401401Invalid secret入力した Secret Keyが無効である
    400STT002Invalid Content Typeapplication/octet-stream以外のContent-Typeが入力される
    400STT003Empty Sound Data音声データ漏れ
    400STT005Invalid Language入力された言語(lang)パラメータをサポートしない
    400STT004Empty Language言語(lang)パラメータ漏れ
    413STT001Exceed Sound Data length入力されたが音声データが最大長さを超過(60秒)
    500STT006Failed to pre-processing音声認識前処理中にエラーが発生
    • 音声データが正常なwavmp3flacであるかどうか確認が必要
    500STT998Failed to STT音声認識中にエラー発生
    • カスタマーサポートに問い合わせる
    500STT999Internal Server Error内部サーバエラー
    • カスタマーサポートに問い合わせる
    --SUCCEEDED処理成功
    --PROCESSING処理中
    --ERROR_SERVER_BUSY余分のサーバリソースがない
    --ERROR_TOKEN_INVALIDトークンが存在しない
    --ERROR_AUDIO_EMPTY音声データが存在しない
    --ERROR_AUDIO_CONVERSION音声変換失敗
    --ERROR_PARAMS_FORMAT_INVALID入力したパラメータ形式が JSONではない
    --ERROR_REQUEST_PARAMETER入力したリクエストパラメータが無効である
    --ERROR_REQUEST_PARAMETER話者が認識できない
    --ERROR_INVALID_SECRET入力した Secret Keyが無効である
    --ERROR_DATA_NOT_FOUNDサーバ内部エラー
    --ERROR_DATA_CONFLICTデータクラッシュ
    --ERROR_INTERNAL_ERRORサーバ内部エラー
    --ERROR_EXTERNAL_ERRORサービス失敗
    --ERROR_TOO_MANY_JOBS処理量超過
    --ERROR_GATEWAY_TIMEOUTタイムオーバー
    --FAILEDその他のエラー

    CLOVA Speech API

    CLOVA Speechサービスで提供する APIの説明は次の通りです。

    API説明
    長文認識 > Object Storageファイルの認識NAVERクラウドプラットフォームの Object Storageに保存されているメディアファイルの固有の URLで長文を認識
    長文認識 > 外部ファイルの認識公開されている音声ファイルの固有の URLで長文を認識
    長文認識 > ローカルファイルの認識ローカルファイルの長文を認識
    長文認識 > 処理状態の確認非同期(async)方式の処理状態を確認
    短文認識最大60秒の短い音声ファイルを認識
    リアルタイムストリーミングの認識リアルタイム音声認識とテキスト変換

    CLOVA Speech関連リソース

    CLOVA Speech APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。


    この記事は役に立ちましたか?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.