Google ra mắt Gemini Omni Flash và Nano Banana 2 Lite: Tạo ảnh, video AI tốc độ cao với chi phí tối ưu | CMC Telecom

Google ra mắt Gemini Omni Flash và Nano Banana 2 Lite: Tạo ảnh, video AI tốc độ cao với chi phí tối ưu

Jul 3, 2026
-
18 views

Ngày 01/07/2026, Google Cloud đã công bố hai mô hình AI tạo sinh mới trên nền tảng Gemini Enterprise Agent Platform, mang lại hiệu suất vượt trội về tốc độ và chi phí cho doanh nghiệp. Gemini Omni Flash (bản xem trước công khai) chuyên về tạo và chỉnh sửa video chất lượng cao, trong khi Nano Banana 2 Lite (phát hành chính thức) tập trung vào tạo sinh hình ảnh siêu nhanh. Các công cụ này giúp đội ngũ sáng tạo và marketing rút ngắn đáng kể thời gian sản xuất nội dung và tối ưu hóa ngân sách.

Nền tảng Gemini Enterprise Agent Platform với hai mô hình mới là Gemini Omni Flash và Nano Banana 2 Lite.

Cả hai mô hình đều cung cấp hiệu suất giá cả tốt nhất trong số các mô hình tiên phong trên thị trường về tạo và chỉnh sửa hình ảnh, video.

Gemini Omni Flash: Tạo và chỉnh sửa video chất lượng cao

Gemini Omni Flash mang khả năng tạo và chỉnh sửa video bằng phương pháp đối thoại trực tiếp vào các ứng dụng của doanh nghiệp. Người dùng có thể dễ dàng nhúng các mô hình media mạnh mẽ này vào các agentic workflow (quy trình làm việc sử dụng agent AI) để tạo, phối lại và tinh chỉnh video mà không cần chuyển đổi nền tảng.

Biểu đồ so sánh hiệu suất chỉnh sửa video của Gemini Omni Flash với các mô hình khác.

Google Cloud đã xây dựng Gemini Omni Flash tập trung vào bốn lĩnh vực chính:

  • Chỉnh sửa đối thoại: Thay đổi nhân vật, điều chỉnh ánh sáng hoặc góc quay bằng ngôn ngữ tự nhiên, đồng thời giữ nguyên âm thanh và video gốc.
  • Đầu vào đa phương thức (multimodal): Kết hợp các đầu vào văn bản, hình ảnh và video để định hướng quá trình tạo video. Gemini Omni Flash tự động tạo âm thanh đi kèm với mỗi video đầu ra, duy trì sự nhất quán về nhân vật, đối tượng và phong cách.
  • Kiến thức thế giới và mô phỏng: Mô hình kết hợp sự hiểu biết trực quan về vật lý với kiến thức của Gemini về lịch sử, khoa học và bối cảnh văn hóa, giúp kết nối giữa chủ nghĩa ảnh thực và cách kể chuyện ý nghĩa.
  • Đồng bộ hóa văn bản và hành động: Hiển thị văn bản và đồ họa dễ đọc trực tiếp trong video, đồng bộ hóa kiểu chữ động và văn bản giải thích với các chuyển động trên màn hình.
Bảng giá của Gemini Omni Flash là 0.10 USD mỗi giây video.

Với mức giá $0.10 cho mỗi giây video đầu ra, Gemini Omni Flash mang lại một trong những mức hiệu suất giá tốt nhất cho khả năng tạo và chỉnh sửa video trên thị trường.

Doanh nghiệp sử dụng Gemini Omni Flash để xây dựng ứng dụng thế hệ mới

Logo của các công ty đang sử dụng Gemini Omni Flash.

Chúng tôi rất vui mừng khi đưa các mô hình mới nhất của Google, bao gồm Gemini Omni Flash và Nano Banana 2 Lite, vào Adobe Firefly, studio AI sáng tạo tất cả trong một của chúng tôi – để giúp các nhà sáng tạo đi từ ý tưởng đến nội dung hoàn chỉnh nhanh hơn. Các mô hình mới này củng cố chiến lược của Adobe trong việc cung cấp các công cụ chuyên nghiệp và các mô hình AI sáng tạo hàng đầu trong một quy trình làm việc kết nối, mang lại cho người sáng tạo sự linh hoạt và kiểm soát.

Matt Chotin, Senior Director of Product, Adobe

Logo Adobe

Điều ngay lập tức thu hút sự chú ý của tôi là phạm vi năng lực của mô hình Gemini Omni Flash. Khả năng VFX đã làm tôi ngạc nhiên, và với tư cách là một nhà sản xuất, điều này mở ra những khả năng rất thú vị. Nhưng khả năng lai ghép mới là điều khiến tôi hào hứng nhất. Bạn có thể kết hợp đội ngũ làm phim live-action truyền thống với sức mạnh của AI ngay trên cùng một phim trường.

Nishant Tahilramani, Creative Director, Invideo

Logo Invideo

Thông qua quan hệ đối tác liên tục với Google, WPP đã được tiếp cận sớm với mô hình Gemini Omni Flash mới và tích hợp nó vào WPP Open, nền tảng marketing agentic của chúng tôi. Khả năng đa phương thức của Gemini Omni Flash—cho phép tham chiếu liền mạch từ hình ảnh, âm thanh và video—kết hợp với chỉnh sửa đối thoại trực quan, đại diện cho một bước tiến vượt bậc trong sản xuất nội dung có kiểm soát bằng AI. Chúng tôi rất vui mừng được hợp tác với Google Cloud để liên tục đẩy lùi các giới hạn của sự sáng tạo do AI điều khiển.

Elav Horwitz, Chief Innovation Officer, WPP

Logo WPP

Nano Banana 2 Lite: Tối ưu cho tốc độ và chi phí

Nano Banana 2 Lite có thể tạo ra một hình ảnh chỉ trong vòng bốn giây. Doanh nghiệp có thể tạo và lặp lại các ý tưởng thiết kế trong vài giây, giúp chuyển từ một trang giấy trắng đến bố cục hoàn hảo ngay lập tức.

Nano Banana 2 Lite kết hợp tốc độ tạo ảnh nhanh với một bước nhảy vọt về chất lượng hình ảnh và khả năng so với mô hình tiền nhiệm, Nano Banana. Các cải tiến cốt lõi bao gồm:

  • Kiến thức thế giới: Nhanh chóng phác thảo các cảnh có bối cảnh chính xác, trực quan hóa dữ liệu thô và các bản mô phỏng theo địa điểm cụ thể.
  • Nhất quán nhân vật: Duy trì nhận dạng nhân vật và độ trung thực của đối tượng qua nhiều lần tạo nhanh để dễ dàng xây dựng các công cụ kịch bản phân cảnh hoặc nhúng tính năng thử đồ ảo cho thương mại điện tử.
  • Tạo văn bản và bản địa hóa nhanh: Phác thảo văn bản quảng cáo ngay lập tức bằng cách hiển thị văn bản dễ đọc trực tiếp trong các thế hệ nhanh để xem kiểu chữ hoạt động như thế nào trên các biến thể quảng cáo được bản địa hóa.
Biểu đồ so sánh hiệu suất tạo và chỉnh sửa ảnh, độ trễ và giá của Nano Banana 2 Lite.

Các doanh nghiệp tăng tốc trải nghiệm hình ảnh với Nano Banana 2 Lite

Tốc độ không còn là giới hạn. Khi việc tạo ra nhanh hơn cả trí tưởng tượng, các nhà sáng tạo có thể tập trung vào ý tưởng thay vì chờ đợi công cụ. Nano Banana 2 Lite mang lại cảm giác đó vào quy trình sáng tạo, cho phép suy nghĩ chuyển thành hình ảnh gần như ngay lập tức. Đối với người dùng của Artlist, điều đó có nghĩa là ít thời gian nhìn vào thanh tiến trình hơn và nhiều thời gian hơn để sáng tạo, lặp lại và cá nhân hóa.

Idan Yonas, Director of AI Content & Innovation, Artlist

Logo Artlist

Nano Banana 2 Lite nhanh và đáng tin cậy, giúp các nhà thiết kế khám phá nhiều ý tưởng hơn để tạo ra những hình ảnh độc đáo trên canvas dựa trên node của Figma Weave. Nó lý tưởng cho việc lặp lại nhanh chóng trong khi vẫn duy trì dòng chảy sáng tạo.

Itay Schiff, Co-founder and Creative Director, Figma

Logo Figma

Chúng tôi đã thử nghiệm Nano Banana 2 Lite để cung cấp năng lượng cho việc tạo hình ảnh theo thời gian thực trong các quy trình làm việc tự động của Manus—từ slide thuyết trình đến trang web. Tốc độ của nó rất phù hợp với các kịch bản này, cho phép AI Agent của chúng tôi lặp lại các hình ảnh một cách nhanh chóng và mang lại kết quả trong vài giây. Chất lượng hình ảnh cũng rất ấn tượng.

Tao Zhang, Co-founder and Chief Product Officer, Manus AI

Logo Manus AI

An toàn và quản trị cấp doanh nghiệp

Các thông tin xác thực nội dung C2PA và watermark ẩn SynthID được bật mặc định để giúp xác minh tính xác thực của nội dung cho cả hai mô hình.

Để xử lý các yêu cầu API đồng thời cao một cách đáng tin cậy ở quy mô lớn, Gemini Enterprise Agent Platform cung cấp provisioned throughput (PT) – thông lượng được cung cấp – cho Nano Banana 2 Lite bắt đầu từ hôm nay. Provisioned throughput cho Gemini Omni Flash sẽ sớm được triển khai.

Bắt đầu xây dựng ngay hôm nay

Doanh nghiệp có thể nhúng các khả năng tạo và chỉnh sửa hình ảnh, video này vào các ứng dụng và quy trình sáng tạo của mình ngay hôm nay. Khám phá các tài liệu sau để bắt đầu:

Tin liên quan

CMC Telecom cam kết hỗ trợ doanh nghiệp của bạn kịp thời

Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp

    Hi! Bạn đang cần tư vấn về dịch vụ của Google?