CMC Telecom cam kết hỗ trợ doanh nghiệp của bạn kịp thời
Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp
Các mô hình ngôn ngữ lớn (LLM) ngày càng mạnh mẽ hơn với kích thước nhỏ hơn, nhưng việc triển khai chúng trên các thiết bị biên như điện thoại thông minh vẫn là một thách thức lớn. Google AI Edge Portal ra đời để giải quyết những vấn đề này, cho phép nhà phát triển thử nghiệm các tác vụ học máy trên một hệ thống gồm hơn 120 loại thiết bị Android đại diện. Mới đây, Google Cloud đã công bố hai tính năng mới giúp mở rộng khả năng của AI Edge Portal cho kỷ nguyên AI tạo sinh: đo lường hiệu năng (benchmarking) và gỡ lỗi (debugging) các mô hình LLM ngay trên thiết bị.
Khi người dùng tương tác với một ứng dụng tích hợp LLM, họ mong đợi hiệu suất nhanh và ổn định. Các vấn đề phổ biến như thời gian khởi tạo lâu có thể khiến ứng dụng trông như bị treo, hoặc tệ hơn là gặp sự cố hoàn toàn nếu mô hình tiêu thụ hết bộ nhớ khả dụng.
Với bản phát hành mới nhất của Google AI Edge Portal, doanh nghiệp có thể chạy các bài đo lường hiệu năng AI tạo sinh tự động trực tiếp trên một phòng lab vật lý với hơn 120 thiết bị Android đa dạng. Cổng thông tin này hỗ trợ đo lường hiệu năng CPU và GPU cho các mô hình LLM ở định dạng LiteRT-LM.

Khi kích hoạt một tác vụ đo lường hiệu năng AI tạo sinh, AI Edge Portal sẽ phân tích các chỉ số quan trọng quyết định trải nghiệm của người dùng cuối:
Với những thông tin chi tiết này, doanh nghiệp có thể tự tin quyết định thiết bị nào sẵn sàng để chạy mô hình của mình và điều chỉnh hoặc tối ưu hóa LLM tốt hơn trước khi phát hành.
Đo lường hiệu năng chỉ hữu ích khi doanh nghiệp có thể khắc phục các vấn đề được phát hiện. Khi một LLM hoạt động kém, việc tìm ra nguyên nhân gốc rễ trong một biểu đồ phức tạp gồm nhiều lớp và hàng nghìn nút là một nhiệm vụ khó khăn, tốn nhiều thời gian.
Để giải quyết vấn đề này, Google Cloud đã tích hợp công cụ Model Explorer vào AI Edge Portal, giúp trực quan hóa và so sánh các biểu đồ mô hình một cách dễ dàng. Nhà phát triển có thể tìm kiếm và định vị các nút cụ thể, so sánh các mô hình cạnh nhau, xem hình dạng tensor, theo dõi đầu vào và đầu ra, và nhiều hơn nữa.
Những hình ảnh trực quan này là một trong những cách hiệu quả nhất để xác định các mục tiêu cần tối ưu hóa, bao gồm:

Với Model Explorer, nhà phát triển có thể xem biểu đồ mô hình, tìm kiếm các lớp cụ thể và so sánh các mô hình cạnh nhau để gỡ lỗi hiệu suất.
Trong kỷ nguyên của LLM trên thiết bị, Google Cloud mong muốn giúp thu hẹp khoảng cách quan trọng trong việc đo lường hiệu năng để mang sức mạnh của AI đến hàng nghìn loại điện thoại thông minh trên thị trường hiện nay. Để sử dụng các tính năng mới nhất này, doanh nghiệp có thể bày tỏ sự quan tâm bằng cách hoàn thành biểu mẫu đăng ký.
Google AI Edge Portal hiện có sẵn trong phiên bản xem trước riêng tư (private preview) cho các khách hàng Google Cloud được đưa vào danh sách cho phép. Trong giai đoạn này, quyền truy cập được cung cấp miễn phí, tuân theo các điều khoản của phiên bản xem trước.
Hãy gửi phản hồi và câu hỏi của bạn cho chúng tôi để được giải đáp