Open WebUI に OpenAI API を追加する場合のおすすめ設定と構成（予算5ドル編）

Local LLMを使っている人は、薄々気がついているかもしれないが、たとえGPT-OSS 120Bを入れたとしても、ChatGPTのようにポンポンとテンポよく、気が利く、整理された回答を返してくれるわけではない。同じGPT-5系のモデルであっても、APIのモデル単体とChatGPTは全く別物である。

さらに、同じGPT系であっても、GPT-5系モデルとGPT-OSSモデルでは性格や得意分野が大きく異なる。

ユースケースごとに、「このケースはクラウド」「このケースはローカル」と使い分ける必要がある。

また、ChatGPTに課金していたとしても、Open AIのモデルは、別払い契約なので、ChatGPTの有償プランに加入していても、OpenAI APIは別契約となるため利用できない。

また、OpenAIのモデルを利用するメリットは、単純な回答性能だけではない。

ローカルLLMの場合、

コンテキストサイズの選定
VRAMやメモリ容量の管理
KV Cacheの調整
量子化方式の選択
モデル更新への追従

などを利用者自身が考える必要がある。一方でOpenAI APIの場合は、それらをほぼ意識する必要がない。利用者はモデルを選択するだけでよく、コンテキストサイズやメモリ消費量を気にせず利用できる。

ローカルLLMを日常的に運用していると当たり前になってしまうが、「モデルを選んだらすぐ使える」というのはクラウドLLMの大きなメリットの一つである。

自分は、保険として、$5だけ課金している。自分の場合、メインはChatGPTで、OpenAI APIはテストや検証用途が中心なので、有効期間1年の間に5ドルで十分足りてしまった。

Open WebUI に OpenAI API を追加する場合のおすすめ構成

月予算 5ドル を前提にすると、モデルを増やしすぎず、管理しやすい構成にするのが重要。

Connection設定

Connection Type External

URL: https://api.openai.com/v1

Auth: Bearer API key

Prefix ID: openai

Provider: Default

API Type: Chat Completions

Model ID

おすすめ例

もちろん、コストや要件によって自由に設定できるが、まずはOpenAI APIの特徴を体感するためのスタートラインとして、以下の2モデルをおすすめする。

gpt-5-mini

gpt-4o-mini

モデル一覧を自動取得すると全モデルが表示されて管理が難しくなるため、Model IDは明示指定することをおすすめする。

理由：

高額モデルの誤利用を防げる
管理者・利用者ともにモデル選択で迷わない
OpenAI側でモデルが追加されても勝手に表示されない
コスト管理、予測がしやすい

追加したモデルは、AllあるいはExternalに表示される。

項目	価格
Input	$0.25 / 1M token
Output	$2.00 / 1M token

項目	価格
Input	$0.15 / 1M token
Output	$0.60 / 1M token

課金

あくまでも検証用途で、本番、常用用途ではないので、最低課金から開始する。

最低チャージ金額は前払い5ドルからで、有効期限は1年間となる。

不足した場合は、前払いを追加できる。

注意点

ChatGPTの課金を行なっている場合でも、Open AI Endpointを使う場合は、課金契約をする必要がある。（同じOpen AI提供でもChat GPTとは別サービス）

5ドルでどれくらい使えるか？

仮に1回の会話を

入力 5000 token

出力 2000 token

とします。

gpt-5-mini

計算

入力

5000 / 1,000,000 × 0.25

= $0.00125

出力

2000 / 1,000,000 × 2.00

= $0.00400

合計

= 約 $0.00525

理論値

$5 ÷ $0.00525

≒ 950回

実運用では履歴やRAGが増えるため

300～600会話

くらいが現実的。

gpt-4o-mini

計算

入力

5000 / 1,000,000 × 0.15

= $0.00075

出力

2000 / 1,000,000 × 0.60

= $0.00120

合計

= 約 $0.00195

理論値

$5 ÷ $0.00195

≒ 2500回

実運用では

1000～1500会話

程度は十分可能