Tool

Phi-3 AI – Microsoft ra mắt dòng mô hình ngôn ngữ nhỏ gọn

Phi-3 AI là gì ?

Microsoft đã chính thức giới thiệu Phi-3 AI, một bộ sưu tập các mô hình ngôn ngữ nhỏ mở (SLM) được đánh giá là có khả năng và hiệu quả nhất về mặt chi phí trong cùng phân khúc.

Nhờ áp dụng phương pháp đào tạo tiên tiến do các nhà nghiên cứu Microsoft phát triển, Phi-3 vượt trội so với các mô hình lớn hơn trên nhiều tiêu chí đánh giá về ngôn ngữ, lập trình và toán học.

“Sẽ không còn là sự chuyển đổi từ mô hình lớn sang nhỏ, mà là sự chuyển đổi sang một tập hợp mô hình đa dạng, nơi khách hàng có thể lựa chọn giải pháp phù hợp nhất với nhu cầu của họ,” Sonali Yadav, Giám đốc sản phẩm chính về AI sáng tạo tại Microsoft, chia sẻ.

Phi-3-mini, mô hình đầu tiên trong dòng Phi-3 với 3,8 tỷ thông số, hiện đã được cung cấp miễn phí trên Danh mục mô hình Azure AI, Hugging Face, Orella và dưới dạng dịch vụ vi mô NVIDIA NIM.

Tuy có kích thước nhỏ gọn, Phi-3-mini lại sở hữu hiệu suất vượt trội so với các mô hình gấp đôi kích thước. Microsoft cũng dự kiến ra mắt các mô hình Phi-3 bổ sung trong thời gian tới, bao gồm Phi-3-small (7 tỷ thông số) và Phi-3-medium (14 tỷ thông số).

Luis Vargas, Phó Giám đốc AI của Microsoft cho biết: “Một số khách hàng có thể chỉ cần các mô hình nhỏ, một số sẽ cần các mô hình lớn và nhiều người sẽ muốn kết hợp cả hai theo nhiều cách khác nhau”.

Ưu điểm chính của SLM là kích thước nhỏ hơn cho phép triển khai trên thiết bị để mang lại trải nghiệm AI có độ trễ thấp mà không cần kết nối mạng. Các trường hợp sử dụng tiềm năng bao gồm cảm biến thông minh, máy ảnh, thiết bị nông nghiệp, v.v. Quyền riêng tư là một lợi ích khác bằng cách lưu giữ dữ liệu trên thiết bị.

Các mô hình ngôn ngữ lớn (LLM) vượt trội trong khả năng lập luận phức tạp trên các tập dữ liệu khổng lồ điểm mạnh phù hợp với các ứng dụng như khám phá thuốc bằng cách hiểu các tương tác giữa các tài liệu khoa học. Tuy nhiên, SLM cung cấp một giải pháp thay thế hấp dẫn để trả lời truy vấn, tóm tắt, tạo nội dung đơn giản hơn và những thứ tương tự.

Victor Botev, CTO và Đồng sáng lập của Iris.ai nhận xét: “Thay vì theo đuổi các mô hình ngày càng lớn hơn, Microsoft đang phát triển các công cụ với dữ liệu được quản lý cẩn thận hơn và đào tạo chuyên biệt” .

“Điều này cho phép cải thiện hiệu suất và khả năng suy luận mà không tốn chi phí tính toán lớn như các mô hình có hàng nghìn tỷ tham số. Việc thực hiện lời hứa này đồng nghĩa với việc phá bỏ rào cản lớn trong việc áp dụng đối với các doanh nghiệp đang tìm kiếm giải pháp AI.”

Giảm thiểu rủi ro an toàn AI

Bất chấp việc quản lý dữ liệu chu đáo, Microsoft nhấn mạnh việc áp dụng các biện pháp an toàn bổ sung cho bản phát hành Phi-3 phản ánh các quy trình tiêu chuẩn của họ cho tất cả các mô hình AI tổng hợp.

Điều này bao gồm các ví dụ đào tạo bổ sung để củng cố các hành vi dự kiến, đánh giá để xác định các lỗ hổng thông qua nhóm và cung cấp các công cụ Azure AI cho khách hàng để xây dựng các ứng dụng đáng tin cậy trên Phi-3.

Ưu điểm nổi bật

  • Khả năng và hiệu quả vượt trội so với các mô hình cùng phân khúc
  • Hiệu suất cao trên nhiều tiêu chí đánh giá về ngôn ngữ, lập trình và toán học
  • Kích thước nhỏ gọn, tiết kiệm chi phí vận hành
  • Dễ dàng triển khai và tích hợp
  • Phù hợp với nhiều ứng dụng đa dạng

Với những ưu điểm nổi bật, Phi-3 hứa hẹn sẽ trở thành lựa chọn tối ưu cho các nhà phát triển và doanh nghiệp đang tìm kiếm giải pháp AI nhỏ gọn, hiệu quả và tiết kiệm chi phí.

Source: https://www.artificialintelligence-news.com/2024/04/24/microsoft-unveils-phi-3-family-compact-language-models/

Bài viết liên quan

Back to top button