Hạ tầng LLM

Một API cho mọi LLM. Thanh toán theo cách của bạn.

Truy cập thống nhất tới mọi model OpenAI. Tương thích OpenAI SDK. Chuyển khoản hoặc crypto.

Lấy API key Đọc tài liệu

Bậc miễn phíTrả theo dùngHủy bất kỳ lúc nào

Định tuyến qua

OpenAI APIđang chạy

Codex Poolđang chạy

Vì sao Zion

Tại sao developers chọn chúng tôi

Một API, mọi model

Chuyển đổi giữa các model OpenAI — gpt-5, gpt-5-mini, dòng o-series — tất cả qua một endpoint duy nhất. Không cần nhiều SDK, không loạn auth. Thêm provider ở phase tới.

Thanh toán linh hoạt

Chuyển khoản hoặc USDT (BSC/TRON) — chọn cách phù hợp với bạn. Không tối thiểu, không cam kết, không bất ngờ.

Một dòng code để bắt đầu

Đã dùng OpenAI SDK? Đổi base_url. Vậy thôi. Code hiện tại tiếp tục chạy—giờ với multi-provider routing.

Mô hình đang hoạt động

Giá real-time cho mọi model.

Giá thực, latency thực. Cập nhật liên tục.

Mô hình	Nhà cung cấp	Context	Input	Output	Tính năng
gpt-5 GPT-5	openai	272K	$5.00/1M	$15.00/1M	toolsvision
gpt-5-mini GPT-5 Mini	openai	272K	$0.50/1M	$2.00/1M	toolsvision
gpt-5-nano GPT-5 Nano	openai	272K	$0.10/1M	$0.40/1M	tools

Hệ định tuyến

Routing thông minh, fallback tự động.

Request của bạn tìm đường tốt nhất. Một provider lỗi, chúng tôi failover ngay.

Fallback tự động.Khi nhà cung cấp trả 429 hoặc 5xx, chúng tôi chuyển tiếp sang mô hình dự phòng.
Theo chi phí.Chọn mô hình rẻ nhất đạt chất lượng — đặt trần và chúng tôi không vượt.
Trần độ trễ.Chuyển sang nhà cung cấp nhanh hơn khi p95 vượt SLO của bạn.
Retry khi timeout.Lỗi mạng và timeout được retry với backoff trước khi trả lỗi.

ruleDự phòng nhà cung cấp

when upstream.status in (429, 5xx)

then thử mô hình tiếp theo trong chuỗi

ruleTrần chi phí

when model.type == 'chat'

then ưu tiên mô hình $/1M ≤ $2.00

ruleSLO độ trễ

when p95(latency) > 2000ms

then chuyển sang family nhanh hơn

ruleLỗi tạm thời

when timeout || network_error

then retry 3 lần với backoff

Đường đi của request

Từ app của bạn đến mô hình phù hợp chỉ một chặng.

Độ trễ trung vị: dưới 15ms.

step 1

Request từ client

App của bạn post tới api.zionrouter.com với Bearer key.

step 2

Router

Auth, rate limit, và giải mô hình trong chưa đầy 2ms.

step 3

Chính sách

Luật định tuyến chọn nhà cung cấp và áp trần ngân sách.

step 4

Gọi upstream

Request được chuyển tới nhà cung cấp đã chọn qua connection ấm.

step 5

Streaming response

Token stream về client; usage được log vào dashboard.

p95 overhead của router: 12ms — cộng thêm vào độ trễ nhà cung cấp.

SDK cắm-và-chạy

Năm giây để chuyển đổi.

Nếu bạn đang dùng OpenAI SDK, đây là tất cả bạn cần đổi:

from openai import OpenAI

client = OpenAI(
    api_key="zr-...",
    base_url="https://api.zionrouter.com/v1",
)

resp = client.chat.completions.create(
    model="gpt-5-mini",
    messages=[{"role": "user", "content": "Hello"}],
)
print(resp.choices[0].message.content)

Tương thích 100% với openai-python & openai-node·base_url: https://api.zionrouter.com/v1

Xây dựng cẩn thận

Dữ liệu của bạn, kiểm soát của bạn.

Không log prompt

Chúng tôi không bao giờ lưu request hoặc response. Route xong, quên ngay.

Lưu trữ: 0 byte nội dung prompt

Mã hóa tại nguồn

API keys được hash. Credentials upstream mã hóa với Fernet. Không bao giờ log.

AES-128-CBC + HMAC-SHA256 (Fernet)

Sẵn sàng SOC2

Audit trail mọi admin action. Mã hóa mọi nơi. Kiến trúc compliance-ready.

Audit từng action · Mã hóa mọi nơi

Bắt đầu routing trong 60 giây.

Nạp bất kỳ số tiền nào để bắt đầu. Không cần thẻ tín dụng.

Lấy API key Đọc tài liệu

Trả theo dùngKhông cần thẻDaily Access từ $0/tháng