Tìm hiểu mô hình AI Gemini 1.5 của Google và những cải tiến đáng giá
19/06/2024 03:03 am | Lượt xem : 962
Chưa đầy hai tháng sau khi ra mắt Gemini, mô hình ngôn ngữ lớn mà Google kỳ vọng sẽ giúp họ chiếm lĩnh ngai vàng ngành công nghiệp AI, công ty đã công bố thế hệ tiếp theo của nó với tên gọi Gemini 1.5. Hiện chỉ dành cho các nhà phát triển và người dùng doanh nghiệp, Google cho biết sẽ sớm phổ cập Gemini 1.5 cho người tiêu dùng đại chúng trong thời gian tới.
Vậy Gemini 1.5 có gì nổi bật? Nó mạnh mẽ đến mức nào? Hãy cùng Tenten.vn tìm hiểu tiếp nhé.
Tăng 300% hiệu suất công việc với AI
Bạn sẽ học được gì?
|
Gemini 1.5 là gì?
Gemini 1.5 là mô hình AI thế hệ mới, được Google ra mắt vào giữa tháng 2 vừa qua, hứa hẹn mang lại hiệu năng vượt trội so với thế hệ trước. Nó cũng cho thấy một bước thay đổi trong hướng tiếp cận AI của Google nhằm cạnh tranh tốt hơn với các đối thủ trong lĩnh vực AI đang rất sôi động hiện nay.
Mô hình Gemini 1.5 đầu tiên đang được thử nghiệm là Gemini 1.5 Pro. Đây là mô hình đa phương thức cỡ trung, được tối ưu để thực hiện hàng loạt tác vụ đa dạng, và được xếp cùng cấp với Gemini 1.0 Ultra – mô hình lớn nhất mà Google đang sở hữu.
Một số điểm nổi bật của Gemini 1.5 bao gồm:
– Khả năng sáng tạo vượt trội: Gemini 1.5 có thể sáng tác đa dạng các nội dung sáng tạo như thơ, nhạc, kịch bản, email, thư từ, v.v. với chất lượng cao và phong cách đa dạng.
– Hiểu biết sâu sắc hơn: Nhờ được đào tạo trên tập dữ liệu khổng lồ, Gemini 1.5 có khả năng hiểu ngôn ngữ và ngữ cảnh sâu sắc hơn, giúp xử lý yêu cầu của người dùng chính xác và hiệu quả.
– Trò chuyện tự nhiên: Gemini 1.5 có thể giao tiếp với người dùng một cách tự nhiên và mượt mà, tạo cảm giác như đang trò chuyện với một người thật.
– Hỗ trợ đa dạng các tác vụ: Gemini 1.5 có thể hỗ trợ người dùng thực hiện nhiều tác vụ khác nhau như viết bài, dịch thuật, tóm tắt văn bản, v.v.
Những cải tiến trên Gemini 1.5
Có rất nhiều điểm mới được Google giới thiệu cùng Gemini 1.5. Đầu tiên, Gemini 1.5 Pro, mô hình đại trà thế hệ mới, hiện có sức mạnh ngang ngửa mô hình Gemini Ultra cao cấp mà công ty công bố cách đây chưa lâu, và vượt trội so với Gemini 1.0 Pro trong 87% các bài benchmark. Nó được phát triển bằng một kỹ thuật ngày càng phổ biến gọi là “Mixture of Experts”, hay MoE, có nghĩa là chỉ chạy một phần của mô hình khi bạn gửi truy vấn, thay vì luôn chạy toàn bộ. Nhờ đó, Gemini 15 Pro không những nhanh hơn mà còn hiệu quả hơn thế hệ trước đó.
Chưa hết, Gemini 1.5 có context window cực lớn, cho phép nó đồng thời xử lý những truy vấn lớn hơn và đọc được nhiều thông tin hơn. Window này có 1 triệu token, trong khi GPT-4 của OpenAI chỉ có 128.000 và Gemini Pro là 32.000.
Về hiệu suất, Gemini 1.5 có tốc độ xử lý nhanh gấp 4 lần so với Gemini 1.0, cho phép nó phản hồi lại yêu cầu người dùng nhanh chóng và hiệu quả hơn. Mô hình mới cũng có khả năng phân bổ tài nguyên chính xác, chỉ sử dụng lượng tài nguyên cần thiết cho từng truy vấn, giúp tiết kiệm chi phí và tối ư hóa hiệu quả sử dụng.
Giống Gemini 1.0, Gemini 1.5 vẫn được trang bị nhiều tính năng hấp dẫn, và được đánh giá là nổi trội hơn các đối thủ, như dịch thuật đa ngôn ngữ, viết mã code, tổng hợp giọng nói, tóm tắt văn bản, sáng tác thơ, nhạc, kịch bản, email với phong cách đa dạng, cũng như khả năng học hỏi và thích nghi với nhu cầu người dùng…
Làm sao để sử dụng Gemini 1.5?
Ở thời điểm hiện tại, Gemini 1.5 chỉ được cung cấp cho người dùng doanh nghiệp và các nhà phát triển, thông qua Vertex AI và AI Studio của Google. Dần dần, nó sẽ thay thế Gemini 1.0, và phiên bản chuẩn của Gemini Pro – chính là phiên bản mà mọi người có thể truy cập tại gemini.google.com cũng như trong các ứng dụng của công ty – sẽ trở thành Gemini 1.5 Pro với context window 128.000 token.
Trong giai đoạn thử nghiệm, người dùng có thể thử context window 1 triệu token mà không tốn thêm khoản phí nào, tuy nhiên độ trễ sẽ dài hơn thông thường, và Google hứa hẹn điều này sẽ được cải thiện trong thời gian tới. Sau khi hết giai đoạn thử nghiệm, bạn sẽ phải trả một khoản phí nhỏ để có được 1 triệu token.
Google còn đang thử nghiệm các giới hạn về đạo đức và an toàn của Gemini 1.5, đặc biệt thận trọng bởi mô hình này có context window quá lớn.
Có thể thấy, Google đang phải bước vào một cuộc đua rất khắc nghiệt để xây dựng nên công cụ AI mạnh mẽ nhất thị trường, trong bối cảnh các doanh nghiệp trên toàn thế giới vẫn loay hoay tối ưu chiến lược AI của riêng mình – và cân nhắc liệu có nên ký kết những thỏa thuận phát triển với OpenAI, Google, hay một hãng nào khác hay không.
Mới đây, OpenAI đã công bố “memory” cho ChatGPT – đối thủ chính của Gemini 1.5 – và có vẻ họ đã sẵn sàng lấn sân sang lĩnh vực tìm kiếm web. Hiện Gemini 1.5 đã có hiệu năng rất ấn tượng, đặc biệt hấp dẫn với bất kỳ ai đã và đang sử dụng hệ sinh thái của Google, nhưng hiển nhiên vẫn còn nhiều điều cần cải tiến.
Tăng 300% hiệu suất công việc với AI
Bạn sẽ học được gì?
|
Bài liên quan
Gemini AI bị chỉ trích vì lỗi sai lệch khi tạo ảnh, Google hứa hẹn khắc phục trong vài tuần tới
OpenAI sử dụng dữ liệu bản quyền trong huấn luyện AI như thế nào?