Claude 3.0 Haiku を使用する Managed Inference and Agent API
この記事の英語版に更新があります。ご覧の翻訳には含まれていない変更点があるかもしれません。
最終更新日 2025年01月24日(金)
Heroku Managed Inference and Agent アドオンは現在パイロット段階です。パイロットの一環として提供される製品は本番環境での使用を目的としたものではなく、ベータサービスとみなされています。また、https://www.salesforce.com/company/legal/agreements.jsp のベータサービス条件が適用されます。
Claude 3.0 Haiku は、Anthropic の Claude 3 ファミリーに属する text-to-text
の大規模言語モデル (LLM) です。コスト効率と安定したパフォーマンスを Claude 3.5 Sonnet よりも低価格で実現するように最適化されています。会話型チャットとツール呼び出し機能をサポートしています。
- モデル ID:
claude-3-haiku
- リージョン:
eu
このモデルの用途
Claude 3.0 Haiku は、簡単なチャットインタラクション、軽量なコード生成、よりシンプルなワークフローに最適です。
使用法
Claude 3.0 Haiku は、Claude の v1/chat/completions API スキーマに従います。
モデルへのアクセスをプロビジョニングするには、claude-3-haiku
をアプリの $APP_NAME
にアタッチします。
heroku ai:models:create -a $APP_NAME claude-3-haiku
環境設定を使用すると、さまざまな方法で claude-3-haiku
を呼び出すことができます。
- Heroku CLI
ai
プラグイン (heroku ai:models:call
) - curl
- Python
- Ruby
- Javascript
curl リクエストの例
リクエストの例を使用してすぐに開始できます。
export INFERENCE_MODEL_ID=$(heroku config:get -a $APP_NAME INFERENCE_MODEL_ID)
export INFERENCE_KEY=$(heroku config:get -a $APP_NAME INFERENCE_KEY)
export INFERENCE_URL=$(heroku config:get -a $APP_NAME INFERENCE_URL)
curl $INFERENCE_URL/v1/chat/completions \
-H "Authorization: Bearer $INFERENCE_KEY" \
-d @- <<EOF
{
"model": "$INFERENCE_MODEL_ID",
"messages": [
{ "role": "user", "content": "Hello!" },
{ "role": "assistant", "content": "Hi there! How can I assist you today?" },
{ "role": "user", "content": "What's the weather like in Portland, Oregon right now?" }
],
"temperature": 0.5,
"max_tokens": 100,
"stream": false,
"tools": [
{
"type": "function",
"function": {
"name": "get_weather",
"description": "Fetches the current weather for a given city.",
"parameters": {
"type": "object",
"properties": {
"city": {
"type": "string",
"description": "The name of the city to get weather for."
}
},
"required": ["city"]
}
}
}
],
"tool_choice": "auto",
"top_p": 0.9
}
EOF