ChatGPT

OpenAI Devday: 9 thông tin bạn cần phải biết nếu quan tâm đến AI

Hiện tại đã kết thúc sự kiện Open AI Devday vào ngày 6/11/2023 vừa qua. Trong bài viết này sẽ cập nhật lại 9 thông tin quan trọng bạn cần phải biết nếu quan tâm đến AI.

9 thông tin quan trọng bạn cần biết về OpenAI sau Devday Event

1. “Custom” được GPT

OpenAI đang triển khai các phiên bản ChatGPT tùy chỉnh, được gọi là GPT. GPT là một cách mới để mọi người tạo phiên bản ChatGPT phù hợp để hữu ích hơn trong cuộc sống hàng ngày, trong các nhiệm vụ cụ thể, tại nơi làm việc hoặc ở nhà. Ví dụ: GPT có thể giúp bạn tìm hiểu các quy tắc của bất kỳ trò chơi cờ nào, giúp dạy toán cho con bạn hoặc thiết kế nhãn dán.

Bất kỳ ai cũng có thể dễ dàng xây dựng GPT của riêng mình, không cần mã hóa. Bạn có thể tạo chúng cho chính mình, chỉ để sử dụng trong nội bộ công ty bạn hoặc cho tất cả mọi người.

Việc tạo một cuộc trò chuyện cũng dễ dàng như bắt đầu một cuộc trò chuyện, cung cấp hướng dẫn và kiến thức bổ sung cũng như chọn những gì nó có thể làm, như tìm kiếm trên web, tạo hình ảnh hoặc phân tích dữ liệu.
Hãy dùng thử tại: chat.openai.com/create.

Các GPT mẫu hiện có sẵn để người dùng ChatGPT Plus và Enterprise dùng thử, bao gồm Canva và Zapier AI Actions. OpenAI dự định sẽ sớm cung cấp GPT cho nhiều người dùng hơn.

2. Ra mắt GPT-4 Turbo 128k

GPT-4 Turbo 128k là một mô hình ngôn ngữ lớn (LLM) được phát triển bởi OpenAI. Đây là phiên bản nâng cấp của GPT-4, với kích thước ngữ cảnh lớn hơn gấp 4 lần, lên tới 128k.

Điều này cho phép GPT-4 Turbo xử lý nhiều thông tin hơn và tạo ra văn bản chất lượng cao hơn.

GPT-4 Turbo 128k được đào tạo trên một tập dữ liệu khổng lồ gồm văn bản và mã, bao gồm các nguồn từ thế giới thực như Wikipedia, Twitter và GitHub. Điều này cho phép nó hiểu và tạo ra văn bản có chất lượng cao, phù hợp với các bối cảnh thực tế.

Dưới đây là một số điểm nổi bật của GPT-4 Turbo 128k:

  • Kích thước ngữ cảnh lớn hơn gấp 4 lần, lên tới 128k
  • Được đào tạo trên một tập dữ liệu khổng lồ gồm văn bản và mã
  • Có thể được sử dụng cho nhiều mục đích khác nhau
  • Hiện đang trong giai đoạn thử nghiệm

3. Chế độ riêng cho phản hồi ra kết quả JSON

Một cách phổ biến để sử dụng Chat Completions là hướng dẫn mô hình luôn trả về JSON theo một định dạng nào đó phù hợp với trường hợp sử dụng của bạn, bằng cách cung cấp một thông báo hệ thống.

Điều này hoạt động tốt, nhưng đôi khi mô hình có thể tạo ra đầu ra không phân tích thành JSON hợp lệ. Ví dụ như trước đó, chúng ta sẽ phải thêm những từ khoá vào promp” Vui lòng trả về định dạng JSON, respone JSON format..v..v

Để ngăn chặn những lỗi này và cải thiện hiệu suất của mô hình, OpenAI đã ra riêng 2 model mới là:
GPT-4-1106-preview hoặc GPT-3.5-turbo-1106, bạn có thể đặt response_format thành { type: “json_object” } để bật chế độ JSON.

Khi chế độ JSON được bật, mô hình sẽ bị ràng buộc để chỉ tạo ra các chuỗi phân tích thành JSON hợp lệ.

4. Ra mắt thêm GPT-3.5-turbo-1106

GPT-3.5-turbo-1106 là phiên bản mới nhất của mô hình ngôn ngữ lớn GPT-3.5 của OpenAI. Mô hình này được phát hành vào ngày 6 tháng 11 năm 2023 và có một số cải tiến đáng kể so với phiên bản trước.

Các cải tiến chính của GPT-3.5-turbo-1106:

  • Kích thước ngữ cảnh tăng lên: GPT-3.5-turbo-1106 có kích thước ngữ cảnh 16K, gấp đôi kích thước của phiên bản trước. Điều này cho phép mô hình hiểu và xử lý nhiều thông tin hơn, dẫn đến kết quả chính xác và phù hợp hơn.
  • Hỗ trợ JSON mode: GPT-3.5-turbo-1106 hiện hỗ trợ JSON mode, cho phép mô hình tạo và hiểu các định dạng JSON. Điều này mở rộng khả năng của mô hình trong các ứng dụng như xử lý dữ liệu và tự động hóa.
  • Hỗ trợ parallel function calling: GPT-3.5-turbo-1106 hiện hỗ trợ parallel function calling, cho phép mô hình gọi nhiều hàm cùng một lúc. Điều này làm tăng hiệu suất của mô hình, đặc biệt là cho các tác vụ yêu cầu xử lý nhiều dữ liệu.

Ưu điểm của GPT-3.5-turbo-1106:

  • Chính xác và phù hợp: GPT-3.5-turbo-1106 có độ chính xác và phù hợp cao hơn so với các phiên bản trước. Điều này là do kích thước ngữ cảnh tăng lên và hỗ trợ JSON mode.
  • Hiệu suất cao: GPT-3.5-turbo-1106 có hiệu suất cao hơn so với các phiên bản trước. Điều này là do hỗ trợ parallel function calling.
  • Phù hợp với nhiều ứng dụng: GPT-3.5-turbo-1106 có thể được sử dụng cho nhiều ứng dụng, bao gồm xử lý ngôn ngữ tự nhiên, tạo nội dung và tự động hóa.

5. Phát hành ASSISTANTS API của OpenAI

Điểm nhấn của ngày hội OpenAI Devday là đã phát hành Assistants API hay còn gọi là API trợ lý (beta) mới, cho phép các nhà phát triển tích hợp trợ lý ảo AI vào các ứng dụng của họ. API này dựa trên mô hình ngôn ngữ ChatGPT của OpenAI, có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi của bạn một cách đầy đủ thông tin.

 

API trợ lý (beta) có một số tính năng chính, bao gồm:

  • Tương tác tự nhiên: API này sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để tạo ra các tương tác tự nhiên và hấp dẫn.
  • Công nghệ tiên tiến: API này dựa trên mô hình ngôn ngữ ChatGPT, là một trong những mô hình ngôn ngữ lớn nhất và tiên tiến nhất trên thế giới.
  • Dễ dàng sử dụng: API này được thiết kế để dễ dàng sử dụng và tích hợp, cho phép các nhà phát triển tạo trợ lý ảo AI cho các ứng dụng của họ chỉ trong vài phút.

API trợ lý (beta) hiện đang trong giai đoạn beta, nhưng nó đã có sẵn cho các nhà phát triển đăng ký. OpenAI đang làm việc để cải thiện API này trong tương lai, với các tính năng mới và nâng cao.

Dưới đây là một số ví dụ về cách API trợ lý (beta) có thể được sử dụng:

  • Chăm sóc khách hàng: Các công ty có thể sử dụng API này để tạo trợ lý ảo AI có thể trả lời câu hỏi của khách hàng và giải quyết các vấn đề.
  • Giáo dục: Các trường học có thể sử dụng API này để tạo trợ lý ảo AI có thể giúp học sinh học tập và nghiên cứu.
  • Giải trí: Các nhà phát triển trò chơi có thể sử dụng API này để tạo trợ lý ảo AI có thể tương tác với người chơi và mang lại trải nghiệm chơi game hấp dẫn hơn.

API trợ lý (beta) của OpenAI là một công cụ mạnh mẽ có thể được sử dụng để tích hợp trợ lý ảo AI vào các ứng dụng. API này vẫn đang được phát triển, nhưng nó đã có sẵn cho các nhà phát triển đăng ký.

6. Ra mắt GPT-4-vision-preview

GPT-4 là một phiên bản mới của GPT-4, mô hình ngôn ngữ lớn (LLM) của OpenAI. Phiên bản này được bổ sung khả năng xử lý hình ảnh, cho phép GPT-4 trả lời các câu hỏi về hình ảnh, tạo văn bản mô tả hình ảnh, và thậm chí là vẽ hình ảnh theo mô tả.

GPT-4-vision-preview được ra mắt vào ngày 6/11/2023, hiện đang trong giai đoạn thử nghiệm và chỉ có sẵn cho các nhà phát triển đã được OpenAI phê duyệt.

Cách thức hoạt động

GPT-4-vision-preview sử dụng một mô hình học máy được đào tạo trên một tập dữ liệu khổng lồ gồm hình ảnh và văn bản. Mô hình này có thể học cách phân tích các đặc điểm của hình ảnh và sử dụng thông tin đó để trả lời các câu hỏi, tạo văn bản mô tả, hoặc vẽ hình ảnh.

Ứng dụng

GPT-4-vision-preview có thể được sử dụng cho nhiều ứng dụng khác nhau, bao gồm:

  • Trả lời các câu hỏi về hình ảnh: GPT-4-vision-preview có thể trả lời các câu hỏi về hình ảnh, chẳng hạn như “Cảnh vật trong hình ảnh là gì?”, “Có bao nhiêu người trong hình ảnh?”, hoặc “Loại động vật nào trong hình ảnh?”
  • Tạo văn bản mô tả hình ảnh: GPT-4-vision-preview có thể tạo văn bản mô tả hình ảnh, chẳng hạn như “Một bức tranh phong cảnh với những ngọn núi xanh và những đám mây trắng”, hoặc “Một bức ảnh chụp một con mèo đang chơi với một quả bóng.”
  • Vẽ hình ảnh theo mô tả: GPT-4-vision-preview có thể vẽ hình ảnh theo mô tả, chẳng hạn như “Vẽ một bức tranh phong cảnh với những ngọn núi xanh và những đám mây trắng”, hoặc “Vẽ một bức ảnh chụp một con mèo đang chơi với một quả bóng.”

Tiềm năng

GPT-4-vision-preview có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực, bao gồm:

  • Trợ lý ảo: GPT-4-vision-preview có thể được sử dụng để tạo các trợ lý ảo có thể trả lời các câu hỏi về hình ảnh và tạo văn bản mô tả hình ảnh.
  • Tự động hóa: GPT-4-vision-preview có thể được sử dụng để tự động hóa các tác vụ liên quan đến hình ảnh, chẳng hạn như mô tả hình ảnh hoặc tạo hình ảnh.
  • Giáo dục: GPT-4-vision-preview có thể được sử dụng để tạo các tài nguyên giáo dục về hình ảnh, chẳng hạn như các trò chơi và hoạt động học tập.

7. Chính thức ra mắt DALL-E 3

DALL-E 3 là một công cụ tạo hình ảnh từ văn bản được phát triển bởi OpenAI. Công cụ này được ra mắt vào ngày 6 tháng 11 năm 2023, và được coi là một bước tiến lớn so với phiên bản trước đó, DALL-E 2.

Ứng dụng:

Việc có thể tạo ra những hình ảnh chân thực và chi tiết hơn nhiều so với DALL-E 2. Công cụ này cũng có thể tạo ra các hình ảnh theo phong cách nghệ thuật khác nhau, chẳng hạn như tranh vẽ, tranh sơn dầu, hoặc tranh graffiti.

Dưới đây là một số tính năng nổi bật của DALL-E 3:

  • Chân thực và chi tiết hơn.
  • Tạo ra các hình ảnh theo phong cách nghệ thuật khác nhau.
  • Dễ dàng sử dụng.

Bài viết liên quan: DALL-E 3 là gì ? Hướng dẫn sử dụng DALL-E 3 miễn phí

Giá cả:

Hiện tại giá của OpenAI đưa ra khi gọi API sẽ là: DALL-E 3 là 0.040$/image đối với kích thước ảnh là 1024×1024. DALL-E 2 là 0.020$/image.

8. Ra mắt chức năng đổi chữ thành giọng nói (text-to-speech)

API của Text-to-speech có cung cấp hai giọng nói cho điểm cuối văn bản transcriptions và dựa trên mô hình Whisper transcriptions v2 mã nguồn mở tiên tiến nhất.

  • Phiên âm âm thanh sang bất kỳ ngôn ngữ nào có âm thanh.
  • Dịch và phiên âm thanh sang tiếng Anh.

Tải lên tệp hiện bị giới hạn ở 25 MB và các loại tệp đầu vào sau được hỗ trợ: mp3mp4mpegmpgam4awavvà webm.

9. Giảm giá thành của GPT-4 Turbo

Dưới đây là bảng cập nhật giá thành OpenAI các model tới thời điểm hiện tại:

Mô hìnhNgữ cảnhGiá cho 1K token đầu vàoGiá cho 1K token đầu ra
GPT-48K$0.03$0.06
GPT-432K$0.06$0.12
GPT-4 Turbo128K1/3 giá GPT-41/2 giá GPT-4
GPT-3.5 Turbo4K$0.0015$0.002
GPT-3.5 Turbo16K$0.003$0.004

Tăng 300% hiệu suất công việc với AI

Bạn sẽ học được gì?
    • Tăng hiệu quả công việc
    • Tăng khả năng phân tích dữ liệu
    • Tăng cường năng lực sáng tạo
    • Tự động hóa các tác vụ thường gặp
    • Tiết kiệm thời gian
  • Tạo nhiều cơ hội công việc mới
NHÓM ZALO TĂNG 300% HIỆU SUẤT CÔNG VIỆC

Bài viết liên quan

Back to top button