OpenAI o1 – Mô hình lý luận mới để giải quyết các vấn đề khó

Minh Tân13 Tháng 9, 2024Last Updated: 13 Tháng 9, 2024

214 3 minutes read

OpenAI o1 là gì ?

OpenAI đã phát triển một loạt mô hình AI mới, được thiết kế để dành nhiều thời gian hơn cho suy nghĩ trước khi phản hồi.

OpenAI o1 hỗ trợ khả năng lập luận thông qua các nhiệm vụ phức tạp và giải quyết những vấn đề khó hơn so với các mô hình trước đây trong lĩnh vực khoa học, lập trình và toán học.

Bài viết liên quan: Codeium – Công cụ AI “ngon, bổ, rẻ” hỗ trợ cho Developer

Mô hình đầu tiên trong loạt này trên ChatGPT và API của mình. Đây là một phiên bản thử nghiệm và sẽ được cập nhật và cải tiến thường xuyên.

Bên cạnh việc phát hành, OpenAI cũng công bố các đánh giá cho phiên bản cập nhật tiếp theo, hiện đang được phát triển.

Làm sao để sử dụng ?

Là một mô hình trí tuệ nhân tạo mới, được thiết kế để tập trung nhiều hơn vào việc suy nghĩ thấu đáo trước khi đưa ra câu trả lời, giống như cách con người giải quyết vấn đề.

Thông qua quá trình huấn luyện, mô hình này học cách cải thiện quá trình suy luận, thử nghiệm nhiều chiến lược khác nhau và nhận ra sai lầm.

Trong các bài kiểm tra, phiên bản cập nhật của mô hình đã đạt kết quả tương đương với các nghiên cứu sinh tiến sĩ trong các bài toán khó về vật lý, hóa học và sinh học, cũng như xuất sắc trong lĩnh vực toán học và lập trình. Ví dụ, trong kỳ thi chọn đội tuyển Olympic Toán Quốc tế, GPT-4o chỉ giải đúng 13% bài toán, trong khi mô hình suy luận đạt 83%. Khả năng lập trình của nó cũng đạt mức 89% trong các cuộc thi Codeforces.

Dù chưa có đầy đủ các tính năng như duyệt web hay tải lên dữ liệu, OpenAI o1 đánh dấu một bước tiến lớn trong việc giải quyết các nhiệm vụ phức tạp, mở ra một tầm cao mới cho năng lực của trí tuệ nhân tạo.

Tính an toàn

OpenAI o1 được phát triển với một phương pháp huấn luyện an toàn mới, tận dụng khả năng suy luận để đảm bảo tuân thủ các quy tắc an toàn và định hướng. Mô hình này có khả năng hiểu và áp dụng các quy tắc an toàn trong ngữ cảnh cụ thể một cách hiệu quả hơn.

Một trong những cách đánh giá mức độ an toàn là kiểm tra khả năng duy trì tuân thủ khi người dùng cố gắng “vượt rào” (jailbreaking). Trong một bài kiểm tra khó, GPT-4o đạt 22 điểm (trên thang 0-100), trong khi phiên bản o1-preview đạt 84 điểm.

Để phù hợp với các khả năng mới của mô hình, OpenAI đã tăng cường công việc liên quan đến an toàn, quản trị nội bộ và hợp tác với chính phủ. Điều này bao gồm việc kiểm tra nghiêm ngặt thông qua khung chuẩn bị, tổ chức các cuộc thử nghiệm an toàn (red teaming), và quá trình đánh giá bởi Hội đồng An toàn & An ninh.

Hơn nữa, OpenAI đã ký kết các thỏa thuận với các Viện An toàn AI tại Mỹ và Anh, cho phép họ tiếp cận sớm phiên bản nghiên cứu của mô hình này để tiến hành đánh giá và thử nghiệm trước và sau khi ra mắt.

Ra mắt OpenAI o1-mini

OpenAI o1-mini là một phiên bản nhỏ hơn của dòng o1, nổi bật với khả năng tạo và sửa lỗi mã phức tạp một cách chính xác. Được thiết kế để cung cấp giải pháp hiệu quả cho các nhà phát triển, o1-mini là mô hình nhanh hơn, rẻ hơn và đặc biệt hiệu quả trong việc lập trình.

Với kích thước nhỏ hơn, o1-mini có giá rẻ hơn 80% so với o1-preview, làm cho nó trở thành một lựa chọn mạnh mẽ và tiết kiệm chi phí cho các ứng dụng đòi hỏi khả năng suy luận nhưng không cần kiến thức rộng lớn về thế giới.

Người dùng ChatGPT Plus và Team có thể truy cập các mô hình o1 ngay từ hôm nay.

Cả o1-preview và o1-mini đều có thể được chọn thủ công trong trình chọn mô hình, với giới hạn tạm thời là 30 tin nhắn mỗi tuần cho o1-preview và 50 tin nhắn mỗi tuần cho o1-mini.

OpenAI đang nỗ lực tăng giới hạn này và cho phép ChatGPT tự động chọn mô hình phù hợp với từng yêu cầu cụ thể.