Tin công nghệ

OpenAI Ra Mắt “Flex Processing” – Giải Pháp AI Giá Rẻ Cho Tác Vụ Không Đòi Hỏi Tốc Độ Cao

openai-ra-mat-flex-processing-giai-phap-ai-gia-re-cho-tac-vu-khong-doi-hoi-toc-do-cao

OpenAI vừa công bố tùy chọn xử lý linh hoạt (Flex Processing) cho các API của mình, cho phép doanh nghiệp giảm tới 60% chi phí khi chấp nhận thời gian phản hồi chậm hơn.

Flex Processing Hoạt Động Như Thế Nào?

✔ Chế độ tiết kiệm: Sử dụng tài nguyên điện toán thấp hơn khi xử lý các yêu cầu không khẩn cấp (ví dụ: phân tích dữ liệu qua đêm, tạo báo cáo tự động).
✔ Giá chỉ từ $0.0005/1K tokens – rẻ hơn 3-5 lần so với API tiêu chuẩn.
✔ Thời gian phản hồi từ 2-15 phút (thay vì vài giây như thông thường).

Đối Tượng Hưởng Lợi Chính

🔹 Startup muốn tối ưu chi phí khi triển khai AI quy mô lớn
🔹 Doanh nghiệp có nhu cầu xử lý batch (hàng loạt) như tổng hợp dữ liệu, dọn dẹp database
🔹 Ứng dụng cho tác vụ background không ảnh hưởng trải nghiệm người dùng

Lý Do OpenAI Triển Khai Tính Năng Này?

1️⃣ Cạnh tranh với AWS Inferentia & Google Cloud TPU – vốn đã có dịch vụ AI chi phí thấp
2️⃣ Mở rộng thị trường sang phân khúc SME vốn nhạy cảm về giá
3️⃣ Tận dụng tài nguyên điện toán nhàn rỗi vào ban đêm hoặc giờ thấp điểm

So Sánh Bảng Giá

Loại API	Giá ($/1K tokens)	Tốc độ phản hồi
GPT-4 Turbo (tiêu chuẩn)	$0.01	2-5 giây
Flex Processing	$0.0005	2-15 phút
GPT-3.5	$0.002	3-10 giây

Để lại một bình luận Hủy