CMC Telecom cam kết hỗ trợ doanh nghiệp của bạn kịp thời
Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp
Ngày 03/10/2025, Google Cloud đã công bố loạt cập nhật quan trọng cho bộ công cụ AI tạo sinh media trên nền tảng Vertex AI. Các mô hình hàng đầu như Gemini 2.5 Flash Image, Imagen 4, và Gemini 2.5 Text-to-Speech (TTS) đã được phát hành chính thức (GA), cùng với các tính năng mới cho mô hình tạo video Veo 3. Những nâng cấp này giúp doanh nghiệp tăng tốc độ sáng tạo nội dung media chất lượng cao ở nhiều định dạng—hình ảnh, âm thanh và video—với khả năng kiểm soát tốt hơn và bảo mật cấp doanh nghiệp.

Khả năng của mô hình chỉnh sửa hình ảnh mới nhất của Google Cloud, Nano Banana, có trong Gemini 2.5 Flash Image, đã nhanh chóng thu hút sự chú ý. Các quy trình làm việc mang tính chuyển đổi như ví dụ dưới đây cho thấy rõ tiềm năng của công nghệ này:

Tinh chỉnh lặp lại với Gemini 2.5 Flash Image

Chỉnh sửa hội thoại theo ngữ cảnh với Gemini 2.5 Flash Image

Suy luận và hiểu không gian địa lý với Gemini 2.5 Flash Image
Phản hồi tích cực từ thị trường cho thấy rõ: các doanh nghiệp hiện có khả năng nhanh chóng tạo và tinh chỉnh media chất lượng cao trên nhiều định dạng và kênh hơn bao giờ hết, mà không ảnh hưởng đến sự hấp dẫn, tính nhất quán hay bảo mật.
Google Cloud đã công bố phiên bản phát hành chính thức (General Availability) của Gemini 2.5 Flash Image. Mô hình tạo và chỉnh sửa hình ảnh tiên tiến này hiện đã sẵn sàng cho môi trường production, được hỗ trợ bởi cơ sở hạ tầng và bảo mật cấp doanh nghiệp của Google Cloud. Ngoài ra, mô hình giờ đây có thể tạo hình ảnh ở nhiều tỷ lệ khung hình khác nhau và hỗ trợ xử lý hàng loạt (batch processing).
Nhiều công ty đã nhanh chóng ứng dụng Gemini 2.5 Flash Image để vượt qua các giới hạn sáng tạo. Dưới đây là một số ví dụ:
Với Gemini 2.5 Flash Image và các công cụ AI chất lượng cao như vậy, theo đúng nghĩa đen, không còn gì là giới hạn nữa. Kết quả là, đội ngũ của chúng tôi chưa bao giờ sáng tạo hơn thế. Chúng tôi đang hợp tác ý tưởng, có thể hình dung chúng nhanh hơn và khởi chạy các chiến dịch trong vài ngày thay vì vài tuần. Nhiệm vụ cốt lõi của chúng tôi luôn là cung cấp cho các nhà sáng tạo và doanh nghiệp những công cụ AI tiên tiến nhất, và việc đưa Gemini 2.5 Flash Image vào tay họ đã hoàn thành lời hứa đó. Đây chắc chắn là thời điểm thú vị nhất để trở thành một nhà sáng tạo.
– Shahar Aizenberg, CMO, Artlist.io
Gemini 2.5 Flash Image đã định nghĩa lại những gì có thể làm được tại Photo Studio của Mercado Libre. Sự sáng tạo, chất lượng thẩm mỹ và khả năng tuân thủ chính xác chỉ dẫn của mô hình đã nâng tầm danh sách sản phẩm của chúng tôi và mở ra những khả năng mới. Giờ đây, giới hạn duy nhất của chúng tôi là trí tưởng tượng.
– Franco Seia, Software Development Manager, Mercado Libre

Veo 3, mô hình tạo video mới nhất của Google Cloud với âm thanh và hội thoại gốc, đã được các nhà sáng tạo nhanh chóng đón nhận. Dựa trên phản hồi người dùng, Google Cloud đã công bố các tính năng mới giúp Veo 3 trên Vertex AI trở nên mạnh mẽ hơn:
Đối với chiến dịch “Be a Genius. Deploy Bravely” của Palo Alto Networks, chúng tôi đã chứng minh rằng bạn không còn phải lựa chọn giữa tốc độ, sự sáng tạo và chi phí. Với Gemini và Veo 3, bạn có cả ba. Giống như khách hàng của mình, chúng tôi đang định hướng trong cuộc cách mạng AI đầy hứa hẹn. Động thái thông minh nhất trong kỷ nguyên mới này không chỉ là áp dụng AI, mà là thực hiện nó một cách an toàn.
– Kelly Waldher, CMO, Palo Alto Networks
Chúng tôi luôn tin rằng tương lai của sự sáng tạo là sự hợp tác năng động giữa con người và công nghệ. Đó là lý do tại sao chúng tôi đang tích hợp các mô hình AI hàng đầu về video, hình ảnh và âm thanh trực tiếp vào gói thuê bao không giới hạn của Envato. Các tín hiệu ban đầu cho thấy việc sử dụng mạnh mẽ các mô hình như Veo 3, giúp tăng tốc sự sáng tạo của cộng đồng và trao quyền cho họ phát triển trong quá trình này.
– Hichame Assi, CEO, Envato
Mô hình chuyển văn bản thành hình ảnh hàng đầu của Google Cloud, Imagen 4, được thiết kế cho sự sáng tạo và tốc độ. Nó cung cấp hình ảnh chân thực, độ nét cao, cùng khả năng render văn bản và typography, biến trí tưởng tượng thành hiện thực nhanh hơn. Imagen 4 hiện đã phát hành chính thức (GA) và sẵn sàng cho production trên Vertex AI.
Tại Shutterstock, sứ mệnh của chúng tôi là trao quyền cho các doanh nghiệp với những thành phần thiết yếu để công việc của họ hiệu quả hơn. Bằng cách đưa các mô hình Imagen 4 của Google vào AI Image Generator, chúng tôi giúp các đội nhóm dễ dàng hơn bao giờ hết để đi từ ý tưởng đến tác động với hình ảnh sẵn sàng cho thị trường trong vài giây. Imagen 4 cho phép chúng tôi cung cấp các sản phẩm chất lượng cao, sẵn sàng thương mại, đáp ứng các tiêu chuẩn mà khách hàng của chúng tôi mong đợi.
– Keenan Kadam, Senior Product Manager, Shutterstock
Google Cloud cũng đã phát hành chính thức (GA) Gemini 2.5 Text-to-Speech (TTS) trên cả mô hình Pro và Flash. Mô hình này ưu tiên sự biểu cảm và khả năng kiểm soát giống con người, giúp thay đổi cách doanh nghiệp xây dựng các ứng dụng giọng nói:
Google Cloud cung cấp một bộ tùy chọn cấp doanh nghiệp để đáp ứng các nhu cầu dự án khác nhau. Dưới đây là hướng dẫn nhanh để lựa chọn:
Để bắt đầu, các doanh nghiệp có thể truy cập Vertex AI Studio cho Gemini 2.5 Flash Image và Gemini 2.5 TTS, và Vertex AI Media Studio cho Veo 3 và Imagen 4.
Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp