- 印刷する
- PDF
ローカルファイルの認識
- 印刷する
- PDF
最新のコンテンツが反映されていません。早急にアップデート内容をご提供できるよう努めております。最新のコンテンツ内容は韓国語ページをご参照ください。
Classic/VPC環境で利用できます。
ローカルに保存されているオーディオ/ビデオファイルを認識し、テキストに変換します。
リクエスト
リクエスト形式を説明します。リクエスト形式は次の通りです。
メソッド | URI |
---|---|
POST | /recognizer/upload |
リクエストヘッダ
CLOVA Speech APIで共通して使用されるヘッダの詳細は、CLOVA Speechの共通ヘッダをご参照ください。
リクエストボディ
リクエストボディの説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
media | File | Required | ローカルオーディオ/ビデオファイル
|
params | Object | Required | パラメータの詳細情報 |
params.language | String | Required | テキスト認識言語
|
params.completion | String | Optional | 認識リクエスト後のレスポンス方法
|
params.callback | String | Conditional | Callback URL
|
params.wordAlignment | Boolean | Optional | 認識結果の音声とテキストをソートして出力するかどうか
|
params.fullText | Boolean | Optional | 認識結果の全テキストを出力するかどうか
|
params.resultToObs | Boolean | Conditional | Object Storageに結果を保存するかどうか
|
params.noiseFiltering | Boolean | Optional | ノイズフィルタリングの有無
|
params.boostings | Array | Optional | キーワードブーストの詳細情報
|
params.useDomainBoostings | Boolean | Optional | ドメインブーストの使用有無
|
params.forbiddens | String | Optional | 要注意キーワード
|
params.diarization | Object | Optional | 話者認識の詳細情報 |
params.diarization.enable | Boolean | Optional | 話者認識するかどうか
|
sed | Object | Optional | イベント検知結果の詳細情報 |
sed.enable | Boolean | Optional | イベント検知するかどうか
|
format | String | Optional | レスポンス結果を返す形式
|
params.boostings
params.boostings
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
words | String | Optional | キーワードブースト対象の単語リスト |
completion
(リクエスト後のレスポンス方式)をasync
にしてリクエストすると、入力した Callback URLアドレスの有無や resultToObs(ObjectStorage)の有無に応じて認識結果を次のように返します。
Callback URL | resultToObs(ObjectStorage) | 結果 |
---|---|---|
URLアドレスあり | True | Callback URLと Object Storageの両方に結果を返す |
URLアドレスあり | False | Callback URLにのみ結果を返す |
URLアドレスなし | True | Object Storageにのみ結果を返す |
URLアドレスなし | False | エラーを返す |
リクエスト例
リクエストのサンプルコードは次の通りです。
レスポンス
レスポンス形式を説明します。
レスポンスボディ
レスポンスボディの説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
result | String | - | レスポンスコード |
message | String | - | レスポンスメッセージ |
token | String | - | 結果トークン |
version | String | - | エンジンバージョン |
params | Object | - | パラメータの詳細情報 |
params.service | String | - | サービスコード |
params.domain | String | - | ドメインのタイプ
|
params.lang | String | - | 認識言語
|
params.completion | String | - | 認識リクエスト後のレスポンス方法
|
params.callback | String | - | Callback URL |
params.diarization | Object | - | 話者認識(分離)の詳細情報 |
params.diarization.enable | Boolean | - | 話者認識(分離)するかどうか
|
params.diarization.speakerCountMin | Integer | - | 最小話者数 |
params.diarization.speakerCountMax | Integer | - | 最大話者数 |
params.sed | Object | - | イベント検知結果 |
params.sed.enable | Boolean | - | イベント検知するかどうか
|
params.boostings | Array | - | キーワードブーストの詳細情報
|
params.forbiddens | String | - | 要注意キーワード
|
params.wordAlignment | Boolean | Optional | 認識結果の音声とテキストをソートして出力するかどうか
|
params.fullText | Boolean | - | 認識結果の全テキストを出力するかどうか
|
params.noiseFiltering | Boolean | - | ノイズフィルタリングの有無
|
params.resultToObs | Boolean | - | Object Storageに結果を保存するかどうか
|
params.priority | Integer | - | 優先順位
|
params.userdata | Object | - | ユーザーデータの詳細情報 |
params.userdata._ncp_DomainCode | String | - | ドメインコード
|
params.userdata._ncp_DomainId | Integer | - | ドメイン ID |
params.userdata._ncp_TaskId | Integer | - | タスク ID
|
params.userdata._ncp_TraceId | String | - | トレース ID
|
progress | Integer | - | 認識進捗率 |
segments | Array | - | segmentsの詳細情報 |
text | String | - | 全テキスト |
confidence | Double | - | 全体の精度 |
speakers | Array | - | 全話者の詳細情報 |
events | Array | - | イベントの詳細情報 |
eventTypes | Array | - | 認識された全イベントの詳細情報 |
params.boostings
params.boostings
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
words | String | - | キーワードブースト対象の単語リスト |
segments
#segments
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
start | Long | - | 分析開始時刻(ms) |
end | Long | - | 分析終了時刻(ms) |
text | String | - | 分析テキスト |
confidence | Double | - | 分析の精度
|
diarization | Object | - | 認識された話者の詳細情報 |
diarization.label | String | - | 認識された話者の番号 |
speaker | Object | - | 変更後の話者の詳細情報 |
speaker.label | String | - | 変更後の話者の番号 |
speaker.name | String | - | 変更後の話者の名前 |
speaker.edited | Boolean | - | 話者は変更されたかどうか
|
words | Array<Long, Long, String> | - | 認識された単語リスト |
words.[0] | Long | - | セグメント開始時刻(ms) |
words.[1] | Long | - | セグメント終了時刻(ms) |
words.[2] | String | - | セグメントテキスト |
textEdited | String | - | 変更内容 |
speakers
speakers
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
label | String | - | すべての話者の番号 |
name | String | - | すべての話者の名前 |
edited | Boolean | - | 話者は変更されたかどうか
|
events
events
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
type | String | - | イベントタイプ |
label | String | - | イベント名 |
labelEdited | String | - | 変更後のイベント名 |
start | Long | - | イベントの開始時刻 |
end | Long | - | イベントの終了時刻 |
eventTypes
eventTypes
の説明は次の通りです。
フィールド | タイプ | 必須の有無 | 説明 |
---|---|---|---|
label | String | - | 認識されたイベント |
レスポンスステータスコード
CLOVA Speech APIで共通して使用されるレスポンスステータスコードの詳細は、CLOVA Speechの共通レスポンスステータスコードをご参照ください。
レスポンス例
レスポンスのサンプルコードは次の通りです。
async
でリクエストして jsonで返す
async
でリクエストして json形式で返すレスポンスのサンプルコードは次の通りです。
sync
でリクエストして jsonで返す
sync
でリクエストして json形式で返すレスポンスのサンプルコードは次の通りです。
sync
でリクエストして srtで返す
sync
でリクエストして srt形式で返すレスポンスのサンプルコードは次の通りです。
sync
でリクエストして smiで返す
sync
でリクエストして smi形式で返すレスポンスのサンプルコードは次の通りです。