Hai tuần qua thật sự “dồn dập” với những tin tức về AI, trong đó có sự ra mắt của Gemini AI vào ngày 6 tháng 12.
Việc ra mắt Gemini phần lớn chứng kiến Google tập trung so sánh phiên bản Ultra với GPT-4 của OpenAI. Tuy nhiên, điều này đã bị lu mờ bởi tranh cãi xung quanh quyết định của Google trong việc phát hành các video quảng cáo trông giống như demo, nhưng thực tế lại trình bày các khả năng minh họa từ các lĩnh vực: speech-to-text, text-to-speech, và vision.
Bài viết liên quan: Gemini 1.5 Pro: Giới thiệu và cách đăng ký dùng thử API miễn phí
Vào thứ 4, ngày 13 tháng 12 vừa qua, Google đã chính thức cho các nhà phát triển thử nghiệm mô hình ngôn ngữ lớn Gemini Pro. Truy cập Gemini Pro hiện có thể thực hiện thông qua hai nền tảng Vertex AI và Google AI Studio.
Bài viết liên quan: Gemini AI của Google ra mắt phiên bản API “miễn phí” cho người sử dụng
Vertex AI hoạt động tương tự như Azure, cho phép bạn triển khai các phiên bản riêng của mô hình Gemini Pro. Google AI Studio, phiên bản nâng cấp của PaLM API cũ (xin vĩnh biệt PaLM 2 Unicorn, người bạn ngắn ngủi), cung cấp một điểm truy cập đơn giản hơn với chứng thực bằng mã thông báo API.
Trong chiến dịch quảng bá Gemini, Google thường so sánh Gemini Pro với GPT-3.5 của OpenAI. Tuy nhiên, họ lại tập trung nhiều hơn vào việc so sánh Gemini Ultra với GPT-4, khiến nhiều người đặt ra câu hỏi:
Vậy, rốt cuộc thì Gemini Pro so với GPT-3.5 ra sao?
Gemini Pro thực sự có thể so sánh với GPT-3.5 như thế nào?
Theo những phát hiện, Gemini Pro thể hiện hiệu suất ấn tượng trên mọi phương diện, bao gồm tốc độ, hiểu đọc, tuân theo hướng dẫn và tạo mã. Các điểm chuẩn này được thực hiện với 10 mẫu cho tất cả các hạng mục, ngoại trừ hiệu suất, có kích thước mẫu lớn hơn là 600, cho thấy kết quả có thể khác nhau tùy người dùng.
Điểm yếu của Gemini không nằm ở khả năng của mô hình, mà nằm ở hai lĩnh vực lân cận: thiết kế API và định hướng AI, cả hai đều cản trở trải nghiệm của nhà phát triển.
Thứ hai, các chính sách của nhóm căn chỉnh AI của Google “vô cùng hạn chế“.
Điều này thể hiện rõ qua việc Gemini Pro từ chối tạo mã tương tác với các API của OpenAI. Công bằng mà nói, Gemini sẽ tạo mã để gọi chính nó, nhưng không biết gói thực sự, thay vào đó tạo mã cho các dịch vụ tổng hợp của Google AI.
Cùng với khả năng tự lọc bối cảnh, mô hình còn chủ động ngăn chặn một số câu hỏi trò chuyện tiềm ẩn nguy hiểm, ví dụ như “yoo dog”.
Mô hình sẽ đáp lại bằng những vần điệu và sau đó tự đánh dấu cảnh báo khả năng quấy rối ngay từ dòng thứ ba – ngay cả khi cài đặt an toàn được đặt ở mức thấp nhất.
Tổng quan về Gemini Pro
Google gần đây đã ra mắt phiên bản Pro của Gemini, hiện có sẵn cho các nhà phát triển và doanh nghiệp xây dựng ứng dụng của riêng họ. Gemini Pro hỗ trợ nhập và xuất văn bản, trong khi Gemini Pro Vision chấp nhận cả văn bản và hình ảnh nhưng chỉ xuất văn bản.
Mô hình này hỗ trợ 38 ngôn ngữ, bao gồm tiếng Anh, tiếng Ả Rập, tiếng Hà Lan, tiếng Pháp, tiếng Đức, tiếng Nhật và tiếng Tây Ban Nha. Trước đây, các mô hình của Google được nhận thấy là nhanh hơn nhiều – đôi khi nhanh hơn 10-20 lần – khi dịch ngôn ngữ, nhưng chất lượng được cho là thấp hơn GPT-4. Các nhà phát triển thành thạo nhiều ngôn ngữ được mong đợi sẽ cung cấp điểm chuẩn toàn diện.
Ưu điểm của Gemini Pro so với GPT-3.5 là khả năng đa phương thức, hỗ trợ cả văn bản và hình ảnh, trong khi GPT-3.5 chỉ giới hạn ở văn bản.
Gemini đi kèm với cửa sổ ngữ cảnh 32K và có kế hoạch cho các cửa sổ ngữ cảnh lớn hơn trong tương lai. Nó được sử dụng miễn phí thông qua Google AI Studio và có các ví dụ về mã cho Python, Android (Kotlin), Node.js, Swift và JavaScript.
Các ví dụ về mã được cung cấp rất tệ. Mã Open in Colab được coi là tệ nhất, có mã không sử dụng được và chắc chắn phải là một biến thể cũ hơn của SDK
So sánh với API và SDK của OpenAI, trải nghiệm của nhà phát triển với Gemini Pro kiếm được điểm C+ cao nhất do các thuộc tính quá phức tạp của nó có thể mang lại lợi ích sau này với các trích dẫn.
Đây là phản hồi của Gemini Pro.
Còn đây là của ChatGPT 3.5
So sánh giá cả giữa Gemini AI và GPT-3.5
Giá của Gemini Pro bao gồm gói miễn phí và gói trả tiền khi bạn sử dụng. Gói miễn phí cho phép tối đa 60 yêu cầu mỗi phút (RPM), trong khi gói trả theo mức sử dụng bắt đầu ở cùng giới hạn tốc độ, nhưng trong quá trình thử nghiệm, nhận thấy rằng nó chỉ trả về lỗi khi vượt quá 60 yêu cầu mỗi phút .
Google tính phí đầu vào ở mức 0,00025 USD cho mỗi 1k ký tự và 0,0025 USD cho mỗi hình ảnh và đầu ra ở mức 0,0005 USD cho mỗi 1k ký tự. Định giá bằng ký tự, mặc dù số đo được tính bằng mã thông báo, vẫn là một quyết định tiếp thị sản phẩm đáng nghi ngờ khác.
Bạn cần thực hiện một phép toán không chính xác một chút vì OpenAI sử dụng sơ đồ định giá dựa trên mã thông báo, tính phí 0,001 USD cho mỗi 1k mã thông báo cho đầu vào và 0,002 USD cho mỗi 1k mã thông báo cho đầu ra.
Xét rằng một mã thông báo có khoảng 4 ký tự, giá của Gemini Pro gần bằng 0,001 USD/1K mã thông báo cho đầu vào và 0,002 USD/1K mã thông báo cho đầu ra. Mức giá này khiến Gemini Pro rẻ hơn 10 lần so với GPT-4 Turbo/Vision nhưng ngang bằng với mức giá GPT-3.5, như được hiển thị trong bảng bên dưới.
Mã Tokens | Gemini Pro | gpt-3.5 Turbo | gpt-4-1106 |
---|---|---|---|
Đầu vào (1k Token) | 0,001 | 0,001 | 0,01 |
Đầu ra (1k Token) | 0,002 | 0,002 | 0,03 |
Đầu vào (1M Token) | 1 | 1 | 10 |
Đầu ra (1M Token) | 2 | 2 | 30 |
Chi phí nhiều | 1x | 1x | 10 lần |
Gemini Pro rõ ràng có giá cực kỳ cạnh tranh. Với mức giá bằng 10% của GPT-4 Turbo và bằng mức giá của GPT-3.5, bạn sẽ cần có lý do chính đáng hoặc niềm tin lý tưởng để không được khuyến khích tài chính để sử dụng Google Gemini.