Versee ra mắt pipeline sản xuất video bằng AI

Công nghệ2025-12-15
Versee ra mắt pipeline sản xuất video bằng AI

Ngày 15/12/2025, team Tech của Versee chính thức ra mắt pipeline sản xuất video tự động bằng AI — thành quả của hơn 6 tháng nghiên cứu và phát triển không ngừng. Đây không chỉ là một sản phẩm công nghệ, mà là sự thay đổi căn bản trong cách Versee sản xuất nội dung, đưa công ty từ mô hình sản xuất thủ công sang mô hình sản xuất thông minh.

Pipeline hoạt động qua 5 giai đoạn chính. Giai đoạn đầu tiên là scriptwriting — nơi các mô hình ngôn ngữ lớn (LLM) được fine-tune riêng cho từng thể loại nội dung sẽ tự động viết kịch bản dựa trên brief đầu vào. Thay vì mất 30-45 phút để viết một kịch bản video ngắn, LLM có thể tạo ra bản nháp chất lượng cao chỉ trong 2 phút, kèm theo nhiều phiên bản khác nhau để team Content lựa chọn.

Giai đoạn thứ hai là AI image generation — tạo hình ảnh minh họa và visual assets cho video. Hệ thống sử dụng các mô hình text-to-image tiên tiến nhất, được kết hợp với thư viện style templates mà đội ngũ Design đã xây dựng, đảm bảo hình ảnh tạo ra phù hợp với brand guidelines của từng kênh.

Sơ đồ quy trình pipeline sản xuất video AI

Giai đoạn thứ ba là video assembly — nơi AI tự động ghép nối hình ảnh, text overlays và transitions thành video hoàn chỉnh theo nhịp điệu và pacing phù hợp. Giai đoạn thứ tư là text-to-speech — hệ thống lồng tiếng tự động với nhiều giọng nói tự nhiên, hỗ trợ cả tiếng Việt và tiếng Anh với khả năng điều chỉnh ngữ điệu và tốc độ.

Kết quả đo lường cho thấy sự cải thiện vượt bậc: thời gian sản xuất 1 video ngắn giảm từ 4 giờ xuống còn 45 phút — tức giảm hơn 80%. Chi phí sản xuất trung bình giảm 65%, trong khi số lượng video có thể sản xuất mỗi ngày tăng từ 5 lên 25. Đặc biệt, tỷ lệ engagement trên các video được sản xuất bằng pipeline AI không hề thấp hơn so với video sản xuất thủ công, chứng minh rằng chất lượng không bị hy sinh cho tốc độ.

So sánh trước và sau khi áp dụng AI vào quy trình sản xuất

Điều quan trọng là pipeline AI không thay thế hoàn toàn con người. Mỗi video đều trải qua quy trình human review nghiêm ngặt trước khi xuất bản. Team Content review kịch bản để đảm bảo thông điệp chính xác và phù hợp ngữ cảnh. Team Design kiểm tra visual quality và brand consistency. Team QA thực hiện kiểm tra cuối cùng về technical quality. Quy trình review này chiếm khoảng 15 phút trong tổng 45 phút sản xuất, nhưng đây là 15 phút quan trọng nhất — nơi sự phán đoán và thẩm mỹ của con người đảm bảo chất lượng đầu ra.

Bước tiếp theo trong roadmap phát triển bao gồm: tích hợp AI video generation để tạo footage thay vì chỉ dùng hình ảnh tĩnh, xây dựng hệ thống A/B testing tự động để tối ưu performance, và mở rộng pipeline sang sản xuất nội dung đa ngôn ngữ phục vụ thị trường quốc tế. Versee đặt mục tiêu đến giữa năm 2026, pipeline sẽ có khả năng sản xuất 100 video chất lượng cao mỗi ngày.