Xây dựng, triển khai và quan sát sản phẩm AI từ một nền tảng dành cho lập trình viên.
VeloxAI hợp nhất định tuyến mô hình, agent, công cụ, kho tri thức, workflow, billing và observability sau các API tương thích OpenAI.
/v1
API có version
SSE
Sẵn sàng streaming
Qdrant
Vector cho RAG
Request tương thích OpenAI
POST /v1/chat/completions
Authorization: Bearer pk_live_...
{
"model": "gpt-4o-mini",
"stream": true,
"messages": [{ "role": "user", "content": "Summarize this ticket" }]
}Agent Builder
Xuất bản assistant dùng tool
Kho tri thức
Câu trả lời có nguồn từ tài liệu riêng
Workflow
Tự động hóa AI qua hàng đợi
Analytics
Token, chi phí, log và cảnh báo
15 phút
TTL của JWT access token
/v1
Public API có version
24 giờ
Thời hạn URL hình ảnh
0
API key plaintext được lưu
Mọi thứ để ship tính năng AI, không chỉ gọi một model.
VeloxAI giữ auth, API key, model routing, agent, tool, RAG, billing và observability đồng bộ qua service có scope và contract typed.
Unified Chat API
Định tuyến request qua OpenAI, Anthropic, Google, Mistral và model local bằng một contract /v1/chat/completions có SSE streaming.
Tìm hiểu thêmAgent Builder
Tạo agent nháp, xuất bản phiên bản ổn định, gắn tool và kho tri thức, rồi mở endpoint agent chat cho ứng dụng.
Tìm hiểu thêmKnowledge Base
Nạp tài liệu, URL và văn bản vào metadata PostgreSQL và vector Qdrant để semantic search và câu trả lời có trích dẫn.
Tìm hiểu thêmWorkflow Automation
Kích hoạt workflow thủ công hoặc qua webhook, chạy node AI và agent, lưu từng kết quả node và execute bằng Redis queue.
Tìm hiểu thêmImage Tools
Tạo, chỉnh sửa, upscale, xóa nền, mô tả và phát hiện nội dung hình ảnh với tracking job và output sẵn sàng lưu trữ.
Tìm hiểu thêmAnalytics + Billing
Theo dõi request, latency, token, credit, lỗi, log, rule cảnh báo và giới hạn plan từ cùng một control plane.
Tìm hiểu thêmChọn đúng model cho từng request.
Dùng một request shape cho model hosted cao cấp và backend local tương thích OpenAI. Theo dõi entitlement, token usage và chi phí ngay từ đầu.
OpenAI
Reasoning tổng quát nhanh, chat đa phương thức và khả năng tương thích ứng dụng rộng.
Anthropic
Reasoning dài, hành vi assistant an toàn hơn và workload orchestration cho agent.
Tác vụ đa phương thức latency thấp và workflow có context lớn.
Mistral + Local
Triển khai theo khu vực, định tuyến model open-weight và backend local tương thích OpenAI.
Xuất bản agent có thể reasoning, truy xuất và hành động.
Agent kết hợp LLM, system prompt, tool, memory và kho tri thức. Draft an toàn, publish version và theo dõi session cùng usage và source.
Draft
Chỉnh prompt, model, memory, tool và guardrail mà không ảnh hưởng live traffic.
Publish
Snapshot cấu hình đã review thành agent_versions bất biến.
Deploy
Mở /v1/agents/:id/chat với API key có scope phù hợp.
Observe
Ghi session, message, tool call, source và token usage.
Bắt đầu miễn phí. Mở rộng bằng credit, limit và kiểm soát rõ ràng.
$0
Cho prototype local và khám phá API.
- - 100 credit/tháng
- - 2 API key
- - 3 agent
- - 20 RPM
- - Quyền truy cập model cơ bản
$29
Cho đội nhỏ đang ship sản phẩm AI đầu tiên.
- - 3.000 credit/tháng
- - 10 API key
- - 20 agent
- - 100 RPM
- - Tất cả model public
$99
Cho đội production có lưu lượng lớn hơn.
- - 12.000 credit/tháng
- - 100 API key
- - Không giới hạn agent
- - 500 RPM
- - Nền tảng SSO và audit
Tùy chỉnh
Cho tổ chức cần model riêng và kiểm soát triển khai.
- - Credit tùy chỉnh
- - Rate limit tùy chỉnh
- - Hỗ trợ chuyên biệt
- - Tùy chọn on-prem
- - SLA review
Câu hỏi đội ngũ phát triển thường hỏi trước khi ship.
Câu trả lời ngắn cho kiến trúc, bảo mật, billing và quyết định workflow AI.
VeloxAI có tương thích OpenAI không?
Có. Endpoint chat lõi là /v1/chat/completions và trả về response theo kiểu OpenAI, gồm SSE chunk kết thúc bằng data: [DONE].
Vector của kho tri thức được lưu ở đâu?
Vector nằm trong Qdrant. PostgreSQL lưu metadata của knowledge base, document và chunk để search có thể mở rộng và dễ audit.
Agent có gọi tool an toàn không?
Agent có thể dùng tool built-in và custom. Custom code execution luôn bị tắt cho đến khi sandbox cứng được cấu hình.
API key có hiện lại full secret không?
Không. Full API key chỉ hiện khi tạo hoặc rotate. VeloxAI chỉ lưu hash và sau đó chỉ hiển thị prefix.
Nền tảng có giới hạn billing không?
Có. Request đi qua rate limit, credit, resource và model entitlement trước khi bắt đầu workload tốn chi phí.
Sẵn sàng đưa AI vào sản phẩm của bạn?
Tạo organization, xác thực email, sinh API key có scope và gọi VeloxAI qua contract giống production.
