AutoGPT

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng – Gemini 2.0 vượt mặt GPT-4o

Vài ngày gần đây, cộng động AI trao đảo với sự kiện ra mắt mô hình mới của Google. Họ cho ra mắt Gemini 2.0 Flash Experimental với khả năng tạo và chỉnh sửa ảnh. Đáng nói hơn, khả năng sáng tạo của nó làm người ta đặt nghi vấn liệu rằng nó sẽ có thể Photoshop? Cùng Tenten.vn tìm hiểu khả năng mà AI mới của Google làm được nhé!

Bước đột phá khi ra mắt Gemini 2.0

Trước đây, LLM chỉ có thể có khả năng sáng tạo văn bản. Với sự ra mắt của Gemini, nó là mô hình LLM đầu tiên tự tạo và chỉnh sửa hình ảnh. Đặc biệt là Gemini 2.0 chẳng cần nhờ đến bất kỳ API bên ngoài nào để tạo ảnh. Chỉ với vài dòng text, AI của Google sẽ tự thực hiện tạo hình ảnh khiến bạn bất ngờ đấy!

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Khi Google ra mắt, các đối thủ như OpenAI đã hoàn toàn bị bỏ xa. Điều đó có nghĩa là bạn đang được trải nghiệm một thứ mà không đâu khác có! Từ việc tạo hoạt ảnh, tô màu ảnh cũ, đến thay đổi bối cảnh thành một hành tinh xa lạ – tất cả đều nằm trong tầm tay bạn, chỉ với vài câu lệnh đơn giản.

Khả năng tạo ảnh kinh ngạc của Gemini 2.0 Flash Experimental

Tạo ảnh động GIF

Một tài khoản X có tên là Cristian Penas đã sử dụng Gemini để tạo ảnh động GIF một bông hoa nảy mầm. Và kết quả thật kinh ngạc. Bông hoa rất giống, nó chuyển động từ lúc là một hạt mầm cho tới khi nở hoa. Đáng chú ý là tất cả được tạo ra bởi 1 dòng text ra lệnh.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Thay đổi nền ảnh

Nếu bạn gửi cho Gemini 2.0 một bức ảnh, nó hoàn toàn có thể thay đổi nền mà vẫn vẫn giữ nguyên chủ thể. Ví dụ như hình dưới đây, tôi đã gửi 1 chiếc ảnh và nhờ Gemini thay đổi background ở trạm không gian. Kết quả tương đối thú vị mặc dù nhìn có vẻ chưa thật lắm!
AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Không chỉ thay đổi phông nền, Gemini còn có thể thay đổi hoàn toàn bức ảnh. Như bức ảnh dưới đây, Gemini đã tạo ra một bức ảnh giúp bạn có thể báo cáo với sếp để xin đi muộn. Đáng chú ý là các bức ảnh có tính nhất quán, nhân vật gần chính dường như không bị thay đổi.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Bạn cũng có thể hoàn toàn thay đổi trang phục, màu tóc, thậm chỉ cả là thay đổi góc mặt của bức ảnh như ở dưới đây. Việc thay đổi mang lại kết quả thật tốt mà không cần dùng đến công cụ chỉnh ảnh nào.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Thậm chí, bạn cũng có thể ngồi lên chiếc xe mà bạn đang thầm mơ ước như cách tôi làm ở dưới đây. Thử thách đặt ra là ra lệnh cho AI để Tôn Ngộ Không ngồi lên chiếc Porsche 911 và kết quả tương đối thú vị!

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Một tài khoản trong cộng J2Team Community có tên Hương Nguyễn đã sử dụng Gemini để tạo ra ảnh mẫu. Đây quả thực là tin vui đối với những người kinh doanh TMĐT hay bán hàng online. Chỉ với 5s, prompt đơn giản không cầu kì cho ra những mẫu ảnh rất thật mà không cần phải mất tiền thuê mẫu.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Xóa watermark

Mô hình này có thể loại bỏ các dấu watermark từ ảnh stock của các nền tảng như Getty Images hay Shutterstock như ví dụ ảnh dưới đây.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Dù được gắn nhãn “thử nghiệm”, khả năng này đã làm dấy lên nhiều tranh cãi về vấn đề bản quyền, khi nó vượt xa các công cụ AI khác như GPT-4o hay Claude, vốn từ chối thực hiện thao tác tương tự.

Tuy nhiên, Gemini không hoàn hảo. Nó gặp khó khăn với watermark trong suốt hoặc phủ diện tích lớn. Bên cạnh đó sau khi xóa, nó sẽ thêm một watermark nhỏ của riêng mình, đánh dấu ảnh đã được chỉnh sửa.

Tạo văn bản trên ảnh

Dường như việc thêm text lên ảnh chưa khó đối với Gemini 2.0. Youtuber MattVidPro AI đã ra lệnh Gemini xóa background rồi thêm dòng chữ “Testing Gemini Native Image Gen”. Kết quả trả về đúng như yêu cầu. Thậm chí, chúng ta hoàn toàn có thể sai AI này tạo ra chiếc thumbnail từ chức năng trên.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Nếu như chưa đủ khó, cùng đến với thử thách lớn hơn. Lần này là yêu cầu thêm chữ D vào trong chiếc áo. Kết quả là Gemini làm đến độ hoàn hảo. Chữ D được thêm vào gần như không phân biết sự khác nhau.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Tô màu ảnh đen trắng

Điều này cũng không thể làm khó được AI này. Mất khoảng 10s, Gemini hoàn thiện bức tranh đường phố Rome. Tổng quan, kết quả đưa ra tương đối ổn khi nhìn lướt qua.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Một người dùng khác có tên Denis Shiryaev đã thử thách Gemini bằng một cách thực tế. Yêu cầu đặt ra là khôi phục ảnh cũ và tô màu đen trắng. Kết quả lại làm chúng ta phải bất ngờ mặc dù có nhiều hạn chế. Dẫu vậy, với một con AI đang cần cải thiện thì kết quả thực sự làm ta phải ngạc nhiên.

AI tạo và chỉnh sửa ảnh đang khuấy đảo cộng đồng mạng - Gemini 2.0 vượt mặt GPT-4o

Tuy nhiên, Shiryaev không ngần ngại vạch trần khuyết điểm của Gemini 2.0 Flash Experimental. Khi đối mặt với những nhiệm vụ đòi hỏi độ sắc nét cao như xử lý ảnh phân giải lớn hay tỉ mỉ chỉnh sửa chữ trên hình, công cụ này vẫn còn lúng túng. Thậm chí, vài vết “rạn nứt” nho nhỏ như hiệu ứng artifact lởn vởn lúc tô màu ảnh cũng bị phát hiện.

Gemini 2.0 Flash có miễn phí không?

Hiện tại Gemini 2.0 Flash Experimental vẫn đang miễn phí với số lượng Tokens nhất định. Tuy nhiên, trong giai đoạn thử nghiệm, cả input và output token của Gemini 2.0, bao gồm cả tạo ảnh, đều miễn phí, với giá 0 USD cho mỗi triệu token. Khi mô hình chuyển sang giai đoạn chính thức, có thể sẽ có chi phí. 

Một điểm bất ngờ là mặc dù tạo ảnh được liệt kê là trong giai đoạn “private preview,” nó vẫn miễn phí cho những người dùng có quyền truy cập, và không có giá được công bố công khai cho tính năng này trên trang giá của Vertex AI

Hướng dẫn trải nghiệm Gemini 2.0 Flash Experimental

Để sử dụng Gemini 2.0 Flash Experimental, truy cập Google AI Studio và đăng nhập bằng tài khoản Google. Chọn mô hình “Gemini 2.0 Flash (Image Generation) Experimental” từ menu thả xuống, sau đó nhập yêu cầu tạo ảnh và trải nghiệm AI thú vị này.

Kết luận

Gemini 2.0 Flash Experimental đánh dấu bước đột phá của Google trong lĩnh vực AI. Nó đã làm sôi động cộng đồng mạng với khả năng tạo và chỉnh sửa ảnh vượt trội. Dù vẫn tồn tại một số hạn chế, phiên bản thử nghiệm miễn phí này vẫn là một công cụ thú vị cho những ai đam mê sáng tạo. Hãy truy cập Google AI Studio ngay hôm nay để tự mình khám phá sức mạnh của AI tương lai cùng Tenten.vn!

Bài viết liên quan

Back to top button