ネットワーク情報をLLMに入力することは、現実世界との接続を確立する上で重要なステップですが、挑戦を伴う場合があります。最も簡単な方法は、ウェブページをスクレイピングして生のHTMLを提供することです。しかし、スクレイピングは複雑であり、しばしばブロックされることがあります。また、生のHTMLには、タグやスクリプトなどの不要な要素が多く含まれています。Reader APIは、URLから主要なコンテンツを抽出し、それをクリーンでLLMに適したテキストに変換することで、これらの問題を解決します。これにより、エージェントやRAGシステムが高品質な入力を確保できるようになります。
出所:https://jina.ai/reader Request
Example:Bearer {{YOUR_API_KEY}}
Request samples
curl --location --request GET 'https://api.302.ai/jina/reader/https://302.ai' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO'
Responses
application/json Modified at 2024-12-03 09:26:57