Một mô hình hình ảnh mới có tên Nano Banana Pro (Gemini 3 Pro Image) hiện đã có sẵn cho các nhà phát triển muốn tạo hình ảnh chất lượng cao hơn.
Nó được xây dựng dựa trên Gemini 3 Pro và ra mắt chỉ vài tháng sau khi phiên bản Nano Banana (Gemini 2.5 Flash Image) được phát hành.
Kể từ lần ra mắt trước đó, cộng đồng nhà phát triển đã sử dụng các tính năng của nó theo nhiều cách khác nhau, bao gồm duy trì tính nhất quán của nhân vật, khôi phục ảnh và thực hiện các chỉnh sửa tập trung trên các canvas lớn.

Mô hình mới này đang được triển khai dưới dạng xem trước có trả phí và được thiết kế để hỗ trợ các ứng dụng đa phương thức thông qua Gemini API, Google AI Studio và Vertex AI.
Nó tạo ra hình ảnh sắc nét hơn, xử lý văn bản trong hình ảnh với độ chính xác cao hơn và vận dụng kiến thức rộng.
Khi tính năng nền tảng Google Search được bật, nó cũng có thể kéo nội dung web phù hợp với yêu cầu của người dùng.

Gemini 3 Pro Image cũng đang được giới thiệu trong nhiều công cụ dành cho nhà phát triển hơn.
Trong Google Antigravity, nền tảng phát triển dựa trên agent của công ty, các coding agent giờ đây có thể sử dụng mô hình này để tạo bản phác thảo UI chi tiết hoặc các tài sản hình ảnh mới trước khi bất kỳ dòng code nào được viết ra.
Các nền tảng sáng tạo như Adobe và Figma cũng đang bổ sung hỗ trợ.

Độ trung thực cao và kiểm soát tốt hơn

Đối với các nhóm xây dựng công cụ cần độ chính xác, Gemini 3 Pro Image cung cấp khả năng kiểm soát ánh sáng, cài đặt máy ảnh, tiêu cự, màu sắc và bố cục.
Các điều khiển này giúp nhà phát triển tạo ra hình ảnh đáp ứng các tiêu chuẩn chuyên nghiệp.

Mô hình hỗ trợ đầu ra 2K và 4K, khiến nó phù hợp cho mục đích sản xuất.
Nó có thể kết hợp nhiều yếu tố thành một thiết kế gắn kết, chẳng hạn như ảnh sản phẩm, logo và các tài liệu tham khảo.
Nó có thể duy trì diện mạo nhất quán cho tối đa năm người, hợp nhất sáu đầu vào có độ trung thực cao, hoặc pha trộn tối đa mười bốn hình ảnh tiêu chuẩn thành một tác phẩm hoàn chỉnh.
Một ứng dụng demo cho thấy cách logo và hình ảnh sản phẩm có thể được ghép đôi để tạo ra các thiết kế mô phỏng.

Văn bản rõ ràng hơn và bản địa hóa dễ dàng hơn

Mô hình này mang lại sự cải thiện rõ rệt so với 2.5 Flash Image khi làm việc với văn bản.
Nó xử lý ngôn ngữ và logic một cách đáng tin cậy hơn và tạo ra văn bản sạch, dễ đọc bên trong hình ảnh.
Điều này làm cho nó hữu ích cho nội dung tiếp thị, tài liệu giáo dục và các dự án khác phụ thuộc vào văn bản chính xác.

Khả năng này có thể được nhìn thấy trong ứng dụng tạo truyện tranh trên Google AI Studio, nơi người dùng có thể tạo truyện tranh nhiều trang có sự xuất hiện của chính họ và một người bạn, đầy đủ với văn bản được tạo kiểu và bố cục.

Mô hình này cũng hỗ trợ bản địa hóa tự nhiên hơn.
Nó hiểu ý nghĩa của các yếu tố trong hình ảnh, vì vậy ngôn ngữ trên biển báo, thực đơn hoặc tài liệu có thể được thay đổi trong khi vẫn giữ nguyên phong cách và bố cục ban đầu thông qua tính năng tạo ảnh-từ-ảnh.

Gemini 3 Pro Image vận dụng từ một cơ sở thông tin rộng lớn, giúp nó tạo ra hình ảnh trực quan chính xác hơn so với các mô hình trước đó.
Khi tính năng nền tảng Google Search được kích hoạt, nó có thể sử dụng dữ liệu web thời gian thực để cho đầu ra thực tế hơn.
Điều này rất hữu ích cho các hình ảnh trực quan đòi hỏi độ chính xác, chẳng hạn như sơ đồ hoặc bản đồ.
Một ứng dụng demo cho phép người dùng tạo đồ họa thông tin về bất kỳ chủ đề nào với nội dung được điều chỉnh theo nhu cầu của họ.

Bắt đầu với mô hình

Bản phát hành này bao gồm nhiều ý tưởng và đề xuất được thu thập từ các nhà phát triển.
Mỗi hình ảnh được tạo ra giờ đây đều bao gồm một hình mờ kỹ thuật số SynthID, giúp xác định khi nào AI được sử dụng.

Các nhà phát triển có thể bắt đầu bằng cách khám phá bộ sưu tập các ứng dụng demo sử dụng Gemini 3 Pro Image.
Sau đó, họ có thể điều chỉnh những ứng dụng đó hoặc đưa mô hình vào các dự án của riêng họ thông qua Gemini API trong Google AI Studio hoặc Vertex AI.
Tài liệu, hướng dẫn gợi ý, sổ tay và diễn đàn dành cho nhà phát triển có sẵn để hỗ trợ kỹ thuật trong suốt quá trình.

Xem thêm:
Gemini 3:
Google kích hoạt các quy trình làm việc AI dạng tác nhân mới cho nhà phát triển

Đăng ký kênh youtube để ủng hộ Cafedev nha các bạn, Thanks you!