OpenAI chuẩn bị ra mắt “siêu phẩm” DALL-E 3

Minh Tân28 Tháng 9, 2023Last Updated: 9 Tháng mười một, 2023

0 504 5 minutes read

DALL·E 3 – so với các hệ thống trước đó là Dall-e-2, đã có khả năng hiểu được nhiều sắc thái và chi tiết hơn rất đáng kể. Điều này cho phép AI dễ dàng chuyển đổi ý tưởng của người dùng thành các hình ảnh vô cùng chính xác và tinh tế.

⬇⬇ Tham gia Group để nhận ngay bộ công cụ AI x3 hiệu suất làm việc ⬇⬇

Thời gian dự kiến ra mắt ?

DALL·E 3 hiện đang ở giai đoạn xem trước nghiên cứu và sẽ có sẵn cho khách hàng ChatGPT Plus và Enterprise vào tháng 10, thông qua API và trong sự kiện Labs vào cuối mùa thu này.

Điểm nổi trội nhất của DALL-E 3

Các hệ thống chuyển văn bản thành hình ảnh hiện đại có xu hướng bỏ qua các từ hoặc mô tả, buộc người dùng phải học kỹ thuật nhanh chóng. DALL·E 3 thể hiện bước nhảy vọt về khả năng tạo ra hình ảnh tuân thủ chính xác văn bản bạn cung cấp.

Thay vì AI tạo ảnh trên thị trường sẽ bỏ qua những prompt (lời nhắc) có nội dung chi tiết. DALL-E 3 thì ngược lại, họ chú trọng tỉ mỉ và chi tiết hoá phần này.

Sự khác biệt giữa DALL-E 2 và DALL-E 3

Tính năng	DALL-2 E	DALL-3 E
Khả năng tạo ra các hình ảnh chi tiết và chân thực	Tốt	Tốt hơn
Khả năng tạo ra các hình ảnh theo nhiều phong cách nghệ thuật khác nhau	Tốt	Rất tốt
Khả năng tạo ra các hình ảnh theo yêu cầu của người dùng	Tốt	Rất tốt
Thời gian tạo ra một hình ảnh	Có thể mất nhiều thời gian	Nhanh chóng và dễ dàng hơn
Giá thành	Miễn phí	Trả phí

Dưới đây là một số nhận xét cụ thể về hai bức ảnh:

Bức ảnh DALL-2 E
- Bức ảnh thể hiện một cầu thủ bóng rổ đang thực hiện cú dunk. Cầu thủ được miêu tả một cách chi tiết và chân thực, từ trang phục, cơ thể, đến tư thế. Bầu trời phía sau cầu thủ được miêu tả theo phong cách nghệ thuật trừu tượng, tạo ra một hiệu ứng thị giác ấn tượng.
- Tuy nhiên, bức ảnh có một số điểm chưa hoàn thiện, chẳng hạn như đường bóng rổ hơi cong và không chính xác.
Bức ảnh DALL-3 E
- Bức ảnh thể hiện một cầu thủ bóng rổ đang thực hiện cú dunk. Cầu thủ được miêu tả chi tiết và chân thực hơn bức ảnh DALL-2 E, từ trang phục, cơ thể, đến tư thế. Bầu trời phía sau cầu thủ được miêu tả theo phong cách nghệ thuật thực tế, tạo ra một cảm giác năng động và phấn khích.
- Bức ảnh này là một ví dụ tuyệt vời về sức mạnh của công nghệ DALL-3 E. Nó không chỉ mô tả một khoảnh khắc thể thao, mà còn là một tác phẩm nghệ thuật độc đáo và sáng tạo.

Nhìn chung, DALL-3 E là một bước tiến đáng kể so với DALL-2 E. Công nghệ này có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực, bao gồm nghệ thuật, thiết kế, và giải trí.

Nhận xét

Dưới góc độ chuyên môn nghệ thuật, mình đánh giá cao sự tiến bộ của công nghệ DALL-3 E so với DALL-2 E. DALL-3 E có thể tạo ra các hình ảnh chi tiết và chân thực hơn, đồng thời có thể tạo ra các hình ảnh theo nhiều phong cách nghệ thuật khác nhau, bao gồm cả các phong cách nghệ thuật trừu tượng.

Điều này cho thấy DALL-3 E có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực, bao gồm nghệ thuật, thiết kế, và giải trí.

Tuy nhiên, DALL-3 E vẫn còn tồn tại một số nhược điểm, chẳng hạn như đôi khi có thể tạo ra các hình ảnh không chính xác hoặc không phù hợp với yêu cầu của người dùng.

Điều này đòi hỏi người dùng cần có sự hiểu biết và tinh tế nhất định khi sử dụng công nghệ này.

Tích hợp trực tiếp trên ChatGPT

DALL-E 3 hứa hẹn những cải tiến đáng kể so với phiên bản tiền nhiệm và giới thiệu khả năng tích hợp liền mạch với ChatGPT.

Một trong những tính năng nổi bật của DALL-E 3 là khả năng hiểu và diễn giải tốt hơn ý định của người dùng khi gặp những lời nhắc chi tiết và dài dòng:

"A middle-aged woman of Asian descent, her dark hair streaked with silver, appears fractured and splintered, intricately embedded within a sea of broken porcelain. The porcelain glistens with splatter paint patterns in a harmonious blend of glossy and matte blues, greens,… pic.twitter.com/QryQz0BtxB
— OpenAI (@OpenAI) September 20, 2023

Ngay cả khi người dùng gặp khó khăn trong việc diễn đạt chính xác ý muốn của họ, ChatGPT vẫn có thể can thiệp để hỗ trợ tạo ra các lời nhắc toàn diện.

DALL-E 3 đã được thiết kế để vượt trội trong việc tạo ra các yếu tố mà những người tiền nhiệm và các trình tạo AI khác trong lịch sử đã phải vật lộn, chẳng hạn như hiển thị các mô tả phức tạp về bàn tay và kết hợp văn bản vào hình ảnh:

"An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote 'Find the universe within you' is etched in bold letters across the… pic.twitter.com/S3cKMkG67T
— OpenAI (@OpenAI) September 20, 2023

Vấn đề pháp lý

Ngoài những tiến bộ kỹ thuật, OpenAI đã thực hiện các bước để giảm thiểu các vấn đề pháp lý tiềm ẩn.

Trong khi phiên bản DALL-E hiện tại có thể bắt chước phong cách của các nghệ sĩ còn sống thì DALL-E 3 sắp ra mắt đã được thiết kế để từ chối yêu cầu sao chép các tác phẩm có bản quyền của họ.

Các nghệ sĩ cũng sẽ có tùy chọn gửi tác phẩm gốc của mình thông qua một biểu mẫu dành riêng trên trang web OpenAI, cho phép họ yêu cầu xóa nếu cần.

AIVA – Trợ lý ảo toàn năng

AIVA là một giải pháp trí tuệ nhân tạo toàn diện gồm hơn 300 trợ lý ảo đa năng và thông minh, giúp tiết kiệm thời gian và công sức bằng cách cung cấp câu trả lời ngay lập tức, thay vì phải tìm kiếm trên Internet hoặc tra cứu tài liệu. Một số tính năng nổi bật của AIVA: