PDF解析タスク作成（公式無料版）

POST

/mineru/api/v4/extract/task

ドキュメント参照： https://mineru.net/apiManage/docs

📌 機能説明
このAPIは指定されたURLに対応するドキュメントの解析に使用され、OCR認識、数式/表の抽出、多形式エクスポートなどの機能をサポートします。コールバック通知または定期的なポーリングによって解析結果を取得でき、多種類のドキュメントの構造化解析シナリオに適用されます。

⚠️ 使用前の注意事項

HTMLファイルの解析には、必ずmodel_versionを"MinerU-HTML"に指定する必要があります。非HTMLファイルの場合は、ニーズに応じてpipelineまたはvlmバージョンを選択できます。

単一ファイルのサイズは200MBを超えてはならず、ファイルのページ数は600ページを超えてはなりません。

ネットワーク制限により、GitHub、AWSなどの海外URLへのリクエストはタイムアウトする可能性があります。

このAPIはファイルの直接アップロードをサポートしていません。

📝 使用手順

このAPIで基本パラメータを設定した後、リクエストを送信してtask_idを取得します。

タスククエリAPIに移動し、task_idを入力して結果を取得します。

🔑 重要な注意点

必須パラメータの検証：urlとmodel_versionは必須パラメータであり、不足するとAPI呼び出しが失敗します。callbackを使用する場合は、必ずseedパラメータを併せて提供する必要があります。

ページ範囲の形式：単一ページ番号、連続したページ区間（例：4-6）、逆から数えたページ（例：-2は最後から2番目のページを意味）をサポートし、複数のルールはコンマで区切ります。

エクスポート形式の説明：デフォルトではmarkdownおよびjson形式でエクスポートされます。追加のエクスポート形式はdocx、html、latexのいずれか1つまたは複数をサポートし、extra_formats配列で指定します。

💰 価格
期間限定で無料です。毎日のクォータには上限があり、使い切ると利用できなくなります。

Request

Header Params

Body Params application/json

Examples

vlmモードMinerU-HTMLモード（Htmlファイルを解析）

{
    "url": "https://cdn-mineru.openxlab.org.cn/demo/example.pdf",
    "model_version": "vlm"
}

Request Code Samples

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

cURL

vlmモードMinerU-HTMLモード（Htmlファイルを解析）

curl --location 'https://api.302.ai/mineru/api/v4/extract/task' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data '{
    "url": "https://cdn-mineru.openxlab.org.cn/demo/example.pdf",
    "model_version": "vlm"
}'

Responses

🟢200成功

application/json

Bodyapplication/json

Example

{
    "code": 0,
    "msg": "ok",
    "trace_id": "79dd6fcac0f4b7e0a21fcc56854329a2",
    "data": {
        "task_id": "a4379d13-95e2-4af1-aae4-04fe5d6fc4cf"
    }
}

Modified at 2026-01-23 02:55:23

PDF解析タスク表示（オープンソース展開版）

PDF解析タスク表示（公式無料版）