Hạ tầng LLM

Một API cho mọi LLM. Thanh toán theo cách của bạn.

Truy cập thống nhất tới mọi model OpenAI. Tương thích OpenAI SDK. Chuyển khoản hoặc crypto.

Bậc miễn phíTrả theo dùngHủy bất kỳ lúc nào
OpenAI APICodex Pool

Định tuyến qua

OpenAI APIđang chạy
Codex Poolđang chạy

Vì sao Zion

Tại sao developers chọn chúng tôi

Một API, mọi model

Chuyển đổi giữa các model OpenAI — gpt-5, gpt-5-mini, dòng o-series — tất cả qua một endpoint duy nhất. Không cần nhiều SDK, không loạn auth. Thêm provider ở phase tới.

Thanh toán linh hoạt

Chuyển khoản hoặc USDT (BSC/TRON) — chọn cách phù hợp với bạn. Không tối thiểu, không cam kết, không bất ngờ.

Một dòng code để bắt đầu

Đã dùng OpenAI SDK? Đổi base_url. Vậy thôi. Code hiện tại tiếp tục chạy—giờ với multi-provider routing.

Mô hình đang hoạt động

Giá real-time cho mọi model.

Giá thực, latency thực. Cập nhật liên tục.

Mô hìnhNhà cung cấpInputOutput
gpt-5
GPT-5
openai$5.00/1M$15.00/1M
gpt-5-mini
GPT-5 Mini
openai$0.50/1M$2.00/1M
gpt-5-nano
GPT-5 Nano
openai$0.10/1M$0.40/1M

Hệ định tuyến

Routing thông minh, fallback tự động.

Request của bạn tìm đường tốt nhất. Một provider lỗi, chúng tôi failover ngay.

  • Fallback tự động.Khi nhà cung cấp trả 429 hoặc 5xx, chúng tôi chuyển tiếp sang mô hình dự phòng.
  • Theo chi phí.Chọn mô hình rẻ nhất đạt chất lượng — đặt trần và chúng tôi không vượt.
  • Trần độ trễ.Chuyển sang nhà cung cấp nhanh hơn khi p95 vượt SLO của bạn.
  • Retry khi timeout.Lỗi mạng và timeout được retry với backoff trước khi trả lỗi.
ruleDự phòng nhà cung cấp
when upstream.status in (429, 5xx)
then thử mô hình tiếp theo trong chuỗi
ruleTrần chi phí
when model.type == 'chat'
then ưu tiên mô hình $/1M ≤ $2.00
ruleSLO độ trễ
when p95(latency) > 2000ms
then chuyển sang family nhanh hơn
ruleLỗi tạm thời
when timeout || network_error
then retry 3 lần với backoff

Đường đi của request

Từ app của bạn đến mô hình phù hợp chỉ một chặng.

Độ trễ trung vị: dưới 15ms.

step 1
Request từ client

App của bạn post tới api.zionrouter.com với Bearer key.

step 2
Router

Auth, rate limit, và giải mô hình trong chưa đầy 2ms.

step 3
Chính sách

Luật định tuyến chọn nhà cung cấp và áp trần ngân sách.

step 4
Gọi upstream

Request được chuyển tới nhà cung cấp đã chọn qua connection ấm.

step 5
Streaming response

Token stream về client; usage được log vào dashboard.

p95 overhead của router: 12ms — cộng thêm vào độ trễ nhà cung cấp.

SDK cắm-và-chạy

Năm giây để chuyển đổi.

Nếu bạn đang dùng OpenAI SDK, đây là tất cả bạn cần đổi:

from openai import OpenAI

client = OpenAI(
    api_key="zr-...",
    base_url="https://api.zionrouter.com/v1",
)

resp = client.chat.completions.create(
    model="gpt-5-mini",
    messages=[{"role": "user", "content": "Hello"}],
)
print(resp.choices[0].message.content)
Tương thích 100% với openai-python & openai-nodebase_url: https://api.zionrouter.com/v1

Xây dựng cẩn thận

Dữ liệu của bạn, kiểm soát của bạn.

Không log prompt

Chúng tôi không bao giờ lưu request hoặc response. Route xong, quên ngay.

Lưu trữ: 0 byte nội dung prompt

Mã hóa tại nguồn

API keys được hash. Credentials upstream mã hóa với Fernet. Không bao giờ log.

AES-128-CBC + HMAC-SHA256 (Fernet)

Sẵn sàng SOC2

Audit trail mọi admin action. Mã hóa mọi nơi. Kiến trúc compliance-ready.

Audit từng action · Mã hóa mọi nơi

Bắt đầu routing trong 60 giây.

Nạp bất kỳ số tiền nào để bắt đầu. Không cần thẻ tín dụng.

Trả theo dùngKhông cần thẻDaily Access từ $0/tháng