[Phần 2] Toàn cảnh Keynote Google Cloud Next 2025: AI, đột phá và chiến lược

Apr 16, 2025

697 views

Tại Google Cloud Next 2025, Google đã chính thức vén màn một hệ sinh thái AI hoàn chỉnh, từ hạ tầng đàm mây, các mô hình AI đột phá, cho tới nền tảng đồng bộ triển khai AI Agent và hỗ trợ doanh nghiệp vận hành thông minh hơn.

Về các Software/Platform hỗ trợ cho các wokload AI, Google cho preview Pathways – là một distributed runtime system do Google DeepMind phát triển, ban đầu dùng nội bộ cho các mô hình AI cực lớn như Gemini, PaLM, và hiện đã mở rộng cho khách hàng trên Google Cloud. Nó đóng vai trò như một bộ điều phối thông minh, giúp chạy các task training và inference AI trên các cụm TPU/GPU cực lớn, tự động phân bổ tài nguyên linh hoạt, đảm bảo hiệu năng cao, độ trễ thấp, và tính liên tục ngay cả khi có lỗi hệ thống. Và để đảm bảo được các tính năng như vậy, Pathways được triển khai trên GKE.

Với các update hỗ trợ training AI trên hạ tầng của Google Cloud, Google bổ sung thêm tính năng cho Cluster Director, bao gồm:

Cluster Director for Slurm: bên cạnh GKE, Google mở rộng hỗ trợ tới cho. Slurm – hệ thống quản lý job phổ biến trong HPC (High Performance Computing).
Bổ sung thêm các tính năng cho Cluster Director, bao gồm khả năng monitor 360° trạng thái của cluster và khả năng healthcheck cho các node có trong cluster, đảm bảo job sẽ được chạy liên tục.

Các update hỗ trợ khả năng suy luận (inference) của AI, bao gồm:

GKE Inference Gateway và GKE Inference Quickstart: Inference Gateway là extension của GKE Gateway, cung cấp khả năng routing giữa các model khác nhau, load balancing số lượng lớn các inference request, tích hợp với Model Armor để loại bỏ các prompt độc hại ngay từ gateway, cùng khả năng monitor các metric inference toàn diện. Trong trường hợp người dùng có ít kinh nghiệm về triển khai hệ thống inference, Inference Quickstart là tính năng mới cho phép tự động dựng hệ thống inference tối ưu nhất dựa vào các internal benchmark của Google với từng model.
vLLM giờ đã hỗ trợ TPU: trước đây vLLM chỉ có thể dùng được GPU, thì hiện tại, vLLM đã có thể tận dụng được sức mạnh của TPU trên GCP, chỉ với một vài thay đổi nhỏ trong cấu hình mà không cần phải viết lại code.

Với khách hàng có triển khai Google Distributed Cloud (GDC) trên hệ thống on-premise, từ Q3 năm nay, Google sẽ đưa mô hình Gemini tới GDC, kết hợp với NVIDIA, giúp triển khai Gemini ngay trong DC doanh nghiệp, không cần đưa dữ liệu ra ngoài.

2. Các cải tiến cho AI model

Tương tự như các đối thủ cạnh tranh, Google tiếp tục tung ra các cải tiến lớn cho danh sách các model AI in-house, tuy nhiên có vẻ như Google đã đưa ra được vision rõ ràng hơn về hệ sinh thái AI của mình. Các cải tiến mới bao gồm:

Đưa Gemini 2.5 Pro và Gemini 2.5 Flash lên Vertex AI: việc sử dụng Vertex AI sẽ tối ưu hơn, do sử dụng được hạ tầng, các tính năng nâng cao và tích hợp sâu với các dịch vụ trên Google Cloud.
Ngoài các model LLM như Gemini, Google cũng đang invest rất nhiều vào các model multi-media. Các cải tiến mới bao gồm:
- Giới thiệu Lyria: model media mới nhất của Google, cho phép tạo âm nhạc từ văn bản (text-to-music)
- Bổ sung tính năng camera control và editing cho Veo 2: người dùng giờ có thể chọn các góc máy camera cho video được generate của mình, hoặc xoá hoàn toàn một chủ thể có trong video.
- Bổ sung tính năng cho Chirp 3: đây là mô hình speech-to-text và text-to-speech của Google. Tại event, Chirp 3 được bổ sung tính năng Instant Custom Voice cho phép tạo custom voice từ 10 giây audio đầu vào. Ngoài ra, model này được update thêm khả năng tách biệt nhiều người nói trong 1 audio input, phù hợp với case như record lại ai nói gì trong cuộc họp, record lại các cuộc trao đổi của call center,…
- Imagen 3 Editing: thêm tính năng cho phép xoá / edit các object có trong 1 bức ảnh một cách chân thực hơn với chất lượng cao hơn.

Với các tính năng bổ sung và model mới, Vertex AI hiện tại đã có đầy đủ tính năng của Media Studio. Người dùng giờ có thể dùng AI generate và edit video, music, ảnh, audio trên một platform duy nhất.
Google cũng công bố 2 model: AlphaFold 3 – Dự đoán cấu trúc phân tử sinh học và WeatherNext – AI dự báo thời tiết chính xác, như một phần cam kết cho cộng đồng khoa học.

3. Multi-Agent Ecosystem

Các tính năng hỗ trợ phát triển và triển khai AI Agent được bổ sung cho Vertex AI bao gồm:

Agent Development Kit (ADK): đây là framework mã nguồn mở do Google phát triển, cho phép người dùng xây dựng các AI agent đơn lẻ hoặc hệ thống các agent tương tác với nhau (multi-agent system), và được triển khai trực tiếp trên Vertex AI.
Agent Garden: tương tự như Model Garden, Agent Garden là nơi lưu trữ các mẫu agent có sẵn, cho phép tái sử dụng agent để tăng tốc quá trình phát triển hoặc tạo POC.
Agent Engine: đây là runtime để triển khai các agent trên production, bao gồm các tính năng nâng cao như hỗ trợ nhiều model khác nhau, khả năng lưu trữ context thông qua Long/Short-term memory, và tích hợp sâu với Vertex AI và Agentspace, cho phép đăng ký agent lên Agentspace để sử dụng.
Agent2Agent Protocol (A2A): đây có thể là một trong những đột phá lớn nhất cho AI Agent. Bằng cách cung cấp một giao thức chuẩn và mở, A2A cho phép các agent từ nhiều nền tảng khác nhau giao tiếp và phối hợp với nhau. Hiện đã có hơn 50 đối tác tham gia tích hợp A2A, bao gồm các ông lớn như Salesforce, ServiceNow, PayPal, Deloitte, UiPath, UKG, Elastic, Weights & Biases,…

Đây có thể nói là những update rất lớn, nhằm cung cấp 1 chuẩn chung và open-source cho AI Agent. Các update này cũng chính thức đưa Vertex AI thành một platform AI hoàn chỉnh, cung cấp toàn bộ các tính năng và dịch vụ từ A-Z, phục vụ cho vòng đời của ứng dụng dựa trên AI.

4. Agentspace

Ngoài việc cung cấp các công cụ để phát triển AI Application và platform để chạy các ứng dụng đó, Google cũng chính thức ra mắt Agentspace – một SaaS (kind of), hướng tới các Enterprise, và trả phí theo dạng license.

Google Agentspace là một nền tảng AI dành cho doanh nghiệp, cho phép mỗi nhân viên trong tổ chức có thể sử dụng các AI agent để hỗ trợ các công việc hàng ngày như tìm kiếm thông tin nội bộ, tương tác với các AI agent của tổ chức phát triển (trên Agent Engine đó), tự động hóa công việc và kết nối tới các ứng dụng khác sẵn có của tổ chức đó. Có thể hiểu Agentspace là một ứng dụng all-in-one cho tất cả các tác vụ high-level hàng ngày mà end-user có thể sử dụng được ngay mà không cần quá nhiều kiến thức kỹ thuật (NotebookLM cũng nằm trong Agentspace).

Tại Next 2025, Agentspace được update thêm các tính năng mới, bao gồm:

Chrome Enterprise Integration: usercó thể dùng thanh search trong Chrome để tìm thông tin nội bộ doanh nghiệp, giúp rút ngắn thao tác và tăng hiệu suất
Agent Gallery: user có thể sử dụng các agent của doanh nghiệp tự build, hoặc của đối tác hoặc trực tiếp từ Google.
Agent Designer: cho phép tự tạo agent bằng kéo thả (no code)
Idea Generation Agent: hỗ trợ quá trình sáng tạo nội dung, cải tiến sản phẩm, chiến lược marketing…
Deep Research Agent: nghiên cứu chuyên sâu về một chủ đề, trả về báo cáo tổng hợp, dễ hiểu, có dẫn nguồn.

5. Bổ sung tính năng AI cho Google Workspace

Từ năm ngoái, Gemini đã được tính hợp sâu vào Google Workspace, giúp hỗ trợ người dùng trong công việc hàng ngày, từ Docs, Sheets, Meet, Drive,… Google đang hướng tới việc cung cấp Gemini như là một AI Assistant toàn diện, bằng việc update thêm các tính năng nâng cao, bao gồm:

Help Me Analyze: Gemini trong Sheets giờ sẽ đóng vai trò như một chuyên gia phân tích dữ liệu, tự động phát hiện xu hướng, bất thường và insight có trong data
Docs Audio Overview: Tạo giọng đọc tự nhiên, chất lượng cao cho các tài liệu trong Google Docs. Có thể sử dụng để tạo podcast.
Google Workspace Flows – Tự động hóa công việc lặp lại hằng ngày, sử dụng các Gems của Gemini.

6. Các High-Impact Agent

Google hiện chia ra làm 5 nhóm AI Agent được sử dụng nhiều và tạo giá trị lớn nhất cho doanh nghiệp bao gồm:

Customer Agents: Google giới thiệu Customer Engagement Suite (Next Gen), một giải pháp toàn diện sử dụng trí tuệ nhân tạo (AI) để nâng cao trải nghiệm khách hàng trên nhiều kênh khác nhau như web, di động, email,..
Creative Agents: những AI agent chuyên biệt cho lĩnh vực sáng tạo (sử dụng Imagen 3, Veo 2,…), giúp tạo hình ảnh, video, thiết kế sáng tạo dễ dàng hơn bao giờ hết
Data Agents: các Agent được tích hợp trong hệ sinh thái dịch vụ data của Google Cloud. Với từng vai trò trong team data, agent có thể hỗ trợ tương ứng với các task, bao gồm:
- Với Data Engineer, data agent hỗ trợ xây dựng pipeline, chuẩn hóa dữ liệu, phát hiện bất thường và tự động tạo metadata.
- Với Data Scientist, data agent hỗ trợ code trên notebook, tự động hóa feature engineering, đề xuất mô hình thông minh, hỗ trợ huấn luyện model quy mô lớn
- Với Data Analyst, data agent cho phép phân tích dữ liệu bằng ngôn ngữ tự nhiên mà không cần SQL. Ngoài ra, data agent cũng có thể gợi ý tạo các lệnh SQL theo nhu cầu phân tích dữ liệu
Coding Agents: các agent được tích hợp vào IDE dể hỗ trợ coding cũng như tự động hóa nhiều phần trong quy trình phát triển phần mềm. Hiện tại, Gemini Code Assist đã có thể tích hợp với Atlassian, Sentry, Snyk, giúp mở rộng khả năng của agent.
Security Agents: các AI agent được Google phát triển để hỗ trợ phân tích và xử lý các mối đe dọa an ninh mạng, giúp tăng tốc độ xử lý sự cố, kiểm tra và đánh giá mã độc cũng như hỗ trợ tự động hóa nhiều tác vụ bảo mật lặp đi lặp lại. Với bản cập nhật mới, Gemini sẽ được bổ sung thêm các tính năng cảnh báo thông minh khi tích hợp với Google SecOps, và khả năng phân tích mã độc cho Google Threat Intelligence.

Ngoài các update nổi bật được đề cập trong keynote, Google năm nay cũng mang tới các cập nhật / cải tiến khác ở scope nhỏ hơn, như ra mắt Cloud WAN, hợp nhất các dịch vụ security vào một solution Google Unified Security, bổ sung các tính năng cho các dịch vụ khác trên Google Cloud,… Chi tiết về các update mới nhất, mọi người có thể tham khảo tại https://cloud.google.com/blog. Hoặc đợi khi event kết thúc vào 11/4, sẽ có post tổng hợp lại các update từ event của Google.

Kết luận lại, chủ đề chính năm nay tại Google Cloud Next vẫn xoay quanh trend AI, nhưng tập trung nhiều vào AI Agent hơn. Không phải tính năng nào cũng đã GA cho người dùng, đa số vẫn Preview và một số còn chưa được ship, người dùng phải đợi tới các quý sau mới được trải nghiệm. Với event lần này, Google đang cho thấy họ dần lấy lại được vị thế dẫn đầu về AI của mình bằng những bước đi rất chắc chắn. Đây cũng sẽ là chiến lược của hãng để chiếm lấy thị phần của 2 đối thủ là AWS và Azure, khi cả 2 chưa thực sự có nhiều các đột phá về AI.

Khi doanh nghiệp Việt Nam đứng trước câu hỏi: Liệu chúng ta đã sẵn sàng cho một hệ sinh thái AI?

Giống như Google đang mở ra một con đường rõ ràng cho việc ứng dụng AI trong doanh nghiệp – không còn là những demo rời rạc hay tính năng rời rạc, mà là một hệ sinh thái gắn kết từ training đến vận hành, từ phát triển đến triển khai. Câu hỏi còn lại chỉ là: ai sẽ bắt đầu vào hành trình này?

CMC Telecom, với vai trò Premier Partner của Google Cloud, đang đồng hành cùng nhiều doanh nghiệp Việt trong việc khai thác hiệu quả hệ sinh thái này. Không chỉ cung cấp hạ tầng, chúng tôi tham gia vào việc tư vấn kiến trúc, hỗ trợ tư vấn từng workload AI để doanh nghiệp không chỉ “thử AI”, mà thực sự “sống với AI”.