[Phần 2] Toàn cảnh Keynote Google Cloud Next 2025: AI, đột phá và chiến lược | CMC Telecom

[Phần 2] Toàn cảnh Keynote Google Cloud Next 2025: AI, đột phá và chiến lược

Apr 16, 2025
-
19 views

Tại Google Cloud Next 2025, Google đã chính thức vén màn một hệ sinh thái AI hoàn chỉnh, từ hạ tầng đàm mây, các mô hình AI đột phá, cho tới nền tảng đồng bộ triển khai AI Agent và hỗ trợ doanh nghiệp vận hành thông minh hơn.

Về các Software/Platform hỗ trợ cho các wokload AI, Google cho preview Pathways – là một distributed runtime system do Google DeepMind phát triển, ban đầu dùng nội bộ cho các mô hình AI cực lớn như Gemini, PaLM, và hiện đã mở rộng cho khách hàng trên Google Cloud. Nó đóng vai trò như một bộ điều phối thông minh, giúp chạy các task training và inference AI trên các cụm TPU/GPU cực lớn, tự động phân bổ tài nguyên linh hoạt, đảm bảo hiệu năng cao, độ trễ thấp, và tính liên tục ngay cả khi có lỗi hệ thống. Và để đảm bảo được các tính năng như vậy, Pathways được triển khai trên GKE.

Với các update hỗ trợ training AI trên hạ tầng của Google Cloud, Google bổ sung thêm tính năng cho Cluster Director, bao gồm:

  • Cluster Director for Slurm: bên cạnh GKE, Google mở rộng hỗ trợ tới cho. Slurm – hệ thống quản lý job phổ biến trong HPC (High Performance Computing).
  • Bổ sung thêm các tính năng cho Cluster Director, bao gồm khả năng monitor 360° trạng thái của cluster và khả năng healthcheck cho các node có trong cluster, đảm bảo job sẽ được chạy liên tục.

Các update hỗ trợ khả năng suy luận (inference) của AI, bao gồm:

  • GKE Inference Gateway và GKE Inference Quickstart: Inference Gateway là extension của GKE Gateway, cung cấp khả năng routing giữa các model khác nhau, load balancing số lượng lớn các inference request, tích hợp với Model Armor để loại bỏ các prompt độc hại ngay từ gateway, cùng khả năng monitor các metric inference toàn diện. Trong trường hợp người dùng có ít kinh nghiệm về triển khai hệ thống inference, Inference Quickstart là tính năng mới cho phép tự động dựng hệ thống inference tối ưu nhất dựa vào các internal benchmark của Google với từng model.
  • vLLM giờ đã hỗ trợ TPU: trước đây vLLM chỉ có thể dùng được GPU, thì hiện tại, vLLM đã có thể tận dụng được sức mạnh của TPU trên GCP, chỉ với một vài thay đổi nhỏ trong cấu hình mà không cần phải viết lại code.

Với khách hàng có triển khai Google Distributed Cloud (GDC) trên hệ thống on-premise, từ Q3 năm nay, Google sẽ đưa mô hình Gemini tới GDC, kết hợp với NVIDIA, giúp triển khai Gemini ngay trong DC doanh nghiệp, không cần đưa dữ liệu ra ngoài.

2. Các cải tiến cho AI model

Tương tự như các đối thủ cạnh tranh, Google tiếp tục tung ra các cải tiến lớn cho danh sách các model AI in-house, tuy nhiên có vẻ như Google đã đưa ra được vision rõ ràng hơn về hệ sinh thái AI của mình. Các cải tiến mới bao gồm:

  • Đưa Gemini 2.5 Pro và Gemini 2.5 Flash lên Vertex AI: việc sử dụng Vertex AI sẽ tối ưu hơn, do sử dụng được hạ tầng, các tính năng nâng cao và tích hợp sâu với các dịch vụ trên Google Cloud.
  • Ngoài các model LLM như Gemini, Google cũng đang invest rất nhiều vào các model multi-media. Các cải tiến mới bao gồm:
    • Giới thiệu Lyria: model media mới nhất của Google, cho phép tạo âm nhạc từ văn bản (text-to-music)
    • Bổ sung tính năng camera control và editing cho Veo 2: người dùng giờ có thể chọn các góc máy camera cho video được generate của mình, hoặc xoá hoàn toàn một chủ thể có trong video.
    • Bổ sung tính năng cho Chirp 3: đây là mô hình speech-to-text và text-to-speech của Google. Tại event, Chirp 3 được bổ sung tính năng Instant Custom Voice cho phép tạo custom voice từ 10 giây audio đầu vào. Ngoài ra, model này được update thêm khả năng tách biệt nhiều người nói trong 1 audio input, phù hợp với case như record lại ai nói gì trong cuộc họp, record lại các cuộc trao đổi của call center,…
    • Imagen 3 Editing: thêm tính năng cho phép xoá / edit các object có trong 1 bức ảnh một cách chân thực hơn với chất lượng cao hơn.
  • Với các tính năng bổ sung và model mới, Vertex AI hiện tại đã có đầy đủ tính năng của Media Studio. Người dùng giờ có thể dùng AI generate và edit video, music, ảnh, audio trên một platform duy nhất.
  • Google cũng công bố 2 model: AlphaFold 3 – Dự đoán cấu trúc phân tử sinh học và WeatherNext – AI dự báo thời tiết chính xác, như một phần cam kết cho cộng đồng khoa học.

3. Multi-Agent Ecosystem

Các tính năng hỗ trợ phát triển và triển khai AI Agent được bổ sung cho Vertex AI bao gồm:

  • Agent Development Kit (ADK): đây là framework mã nguồn mở do Google phát triển, cho phép người dùng xây dựng các AI agent đơn lẻ hoặc hệ thống các agent tương tác với nhau (multi-agent system), và được triển khai trực tiếp trên Vertex AI.
  • Agent Garden: tương tự như Model Garden, Agent Garden là nơi lưu trữ các mẫu agent có sẵn, cho phép tái sử dụng agent để tăng tốc quá trình phát triển hoặc tạo POC.
  • Agent Engine: đây là runtime để triển khai các agent trên production, bao gồm các tính năng nâng cao như hỗ trợ nhiều model khác nhau, khả năng lưu trữ context thông qua Long/Short-term memory, và tích hợp sâu với Vertex AI và Agentspace, cho phép đăng ký agent lên Agentspace để sử dụng.
  • Agent2Agent Protocol (A2A): đây có thể là một trong những đột phá lớn nhất cho AI Agent. Bằng cách cung cấp một giao thức chuẩn và mở, A2A cho phép các agent từ nhiều nền tảng khác nhau giao tiếp và phối hợp với nhau. Hiện đã có hơn 50 đối tác tham gia tích hợp A2A, bao gồm các ông lớn như Salesforce, ServiceNow, PayPal, Deloitte, UiPath, UKG, Elastic, Weights & Biases,…

Đây có thể nói là những update rất lớn, nhằm cung cấp 1 chuẩn chung và open-source cho AI Agent. Các update này cũng chính thức đưa Vertex AI thành một platform AI hoàn chỉnh, cung cấp toàn bộ các tính năng và dịch vụ từ A-Z, phục vụ cho vòng đời của ứng dụng dựa trên AI.

4. Agentspace

Ngoài việc cung cấp các công cụ để phát triển AI Application và platform để chạy các ứng dụng đó, Google cũng chính thức ra mắt Agentspace – một SaaS (kind of), hướng tới các Enterprise, và trả phí theo dạng license.

Google Agentspace là một nền tảng AI dành cho doanh nghiệp, cho phép mỗi nhân viên trong tổ chức có thể sử dụng các AI agent để hỗ trợ các công việc hàng ngày như tìm kiếm thông tin nội bộ, tương tác với các AI agent của tổ chức phát triển (trên Agent Engine đó), tự động hóa công việc và kết nối tới các ứng dụng khác sẵn có của tổ chức đó. Có thể hiểu Agentspace là một ứng dụng all-in-one cho tất cả các tác vụ high-level hàng ngày mà end-user có thể sử dụng được ngay mà không cần quá nhiều kiến thức kỹ thuật (NotebookLM cũng nằm trong Agentspace).

Tại Next 2025, Agentspace được update thêm các tính năng mới, bao gồm:

  • Chrome Enterprise Integration: usercó thể dùng thanh search trong Chrome để tìm thông tin nội bộ doanh nghiệp, giúp rút ngắn thao tác và tăng hiệu suất
  • Agent Gallery: user có thể sử dụng các agent của doanh nghiệp tự build, hoặc của đối tác hoặc trực tiếp từ Google.
  • Agent Designer: cho phép tự tạo agent bằng kéo thả (no code)
  • Idea Generation Agent: hỗ trợ quá trình sáng tạo nội dung, cải tiến sản phẩm, chiến lược marketing…
  • Deep Research Agent: nghiên cứu chuyên sâu về một chủ đề, trả về báo cáo tổng hợp, dễ hiểu, có dẫn nguồn.

5. Bổ sung tính năng AI cho Google Workspace

Từ năm ngoái, Gemini đã được tính hợp sâu vào Google Workspace, giúp hỗ trợ người dùng trong công việc hàng ngày, từ Docs, Sheets, Meet, Drive,… Google đang hướng tới việc cung cấp Gemini như là một AI Assistant toàn diện, bằng việc update thêm các tính năng nâng cao, bao gồm:

  • Help Me Analyze: Gemini trong Sheets giờ sẽ đóng vai trò như một chuyên gia phân tích dữ liệu, tự động phát hiện xu hướng, bất thường và insight có trong data
  • Docs Audio Overview: Tạo giọng đọc tự nhiên, chất lượng cao cho các tài liệu trong Google Docs. Có thể sử dụng để tạo podcast.
  • Google Workspace Flows – Tự động hóa công việc lặp lại hằng ngày, sử dụng các Gems của Gemini.

6. Các High-Impact Agent

Google hiện chia ra làm 5 nhóm AI Agent được sử dụng nhiều và tạo giá trị lớn nhất cho doanh nghiệp bao gồm:

  • Customer Agents: Google giới thiệu Customer Engagement Suite (Next Gen), một giải pháp toàn diện sử dụng trí tuệ nhân tạo (AI) để nâng cao trải nghiệm khách hàng trên nhiều kênh khác nhau như web, di động, email,..
  • Creative Agents: những AI agent chuyên biệt cho lĩnh vực sáng tạo (sử dụng Imagen 3, Veo 2,…), giúp tạo hình ảnh, video, thiết kế sáng tạo dễ dàng hơn bao giờ hết
  • Data Agents: các Agent được tích hợp trong hệ sinh thái dịch vụ data của Google Cloud. Với từng vai trò trong team data, agent có thể hỗ trợ tương ứng với các task, bao gồm:
    • Với Data Engineer, data agent hỗ trợ xây dựng pipeline, chuẩn hóa dữ liệu, phát hiện bất thường và tự động tạo metadata.
    • Với Data Scientist, data agent hỗ trợ code trên notebook, tự động hóa feature engineering, đề xuất mô hình thông minh, hỗ trợ huấn luyện model quy mô lớn
    • Với Data Analyst, data agent cho phép phân tích dữ liệu bằng ngôn ngữ tự nhiên mà không cần SQL. Ngoài ra, data agent cũng có thể gợi ý tạo các lệnh SQL theo nhu cầu phân tích dữ liệu
  • Coding Agents: các agent được tích hợp vào IDE dể hỗ trợ coding cũng như tự động hóa nhiều phần trong quy trình phát triển phần mềm. Hiện tại, Gemini Code Assist đã có thể tích hợp với Atlassian, Sentry, Snyk, giúp mở rộng khả năng của agent.
  • Security Agents: các AI agent được Google phát triển để hỗ trợ phân tích và xử lý các mối đe dọa an ninh mạng, giúp tăng tốc độ xử lý sự cố, kiểm tra và đánh giá mã độc cũng như hỗ trợ tự động hóa nhiều tác vụ bảo mật lặp đi lặp lại. Với bản cập nhật mới, Gemini sẽ được bổ sung thêm các tính năng cảnh báo thông minh khi tích hợp với Google SecOps, và khả năng phân tích mã độc cho Google Threat Intelligence.

Ngoài các update nổi bật được đề cập trong keynote, Google năm nay cũng mang tới các cập nhật / cải tiến khác ở scope nhỏ hơn, như ra mắt Cloud WAN, hợp nhất các dịch vụ security vào một solution Google Unified Security, bổ sung các tính năng cho các dịch vụ khác trên Google Cloud,… Chi tiết về các update mới nhất, mọi người có thể tham khảo tại https://cloud.google.com/blog. Hoặc đợi khi event kết thúc vào 11/4, sẽ có post tổng hợp lại các update từ event của Google.

Kết luận lại, chủ đề chính năm nay tại Google Cloud Next vẫn xoay quanh trend AI, nhưng tập trung nhiều vào AI Agent hơn. Không phải tính năng nào cũng đã GA cho người dùng, đa số vẫn Preview và một số còn chưa được ship, người dùng phải đợi tới các quý sau mới được trải nghiệm. Với event lần này, Google đang cho thấy họ dần lấy lại được vị thế dẫn đầu về AI của mình bằng những bước đi rất chắc chắn. Đây cũng sẽ là chiến lược của hãng để chiếm lấy thị phần của 2 đối thủ là AWS và Azure, khi cả 2 chưa thực sự có nhiều các đột phá về AI.

Khi doanh nghiệp Việt Nam đứng trước câu hỏi: Liệu chúng ta đã sẵn sàng cho một hệ sinh thái AI?

Giống như Google đang mở ra một con đường rõ ràng cho việc ứng dụng AI trong doanh nghiệp – không còn là những demo rời rạc hay tính năng rời rạc, mà là một hệ sinh thái gắn kết từ training đến vận hành, từ phát triển đến triển khai. Câu hỏi còn lại chỉ là: ai sẽ bắt đầu vào hành trình này?

CMC Telecom, với vai trò Premier Partner của Google Cloud, đang đồng hành cùng nhiều doanh nghiệp Việt trong việc khai thác hiệu quả hệ sinh thái này. Không chỉ cung cấp hạ tầng, chúng tôi tham gia vào việc tư vấn kiến trúc, hỗ trợ tư vấn từng workload AI để doanh nghiệp không chỉ “thử AI”, mà thực sự “sống với AI”.

CMC Telecom cam kết hỗ trợ doanh nghiệp của bạn kịp thời

Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp