AI TỐT
Chia sẻ kiến thức AI để tốt hơn

Tôi đã thử nghiệm 21 trường hợp sử dụng Google Nano Banana Pro (Đừng lãng phí thời gian: Kết quả ở đây)

20 phút đọc
Joe Njenga
Joe Njenga

Featured Image Các trường hợp sử dụng Google Nano Banana Pro - Ảnh bìa - Tác giả

Nếu bạn muốn ngừng lãng phí thời gian vào công việc thiết kế, Google vừa ra mắt Nano Banana Pro, và tôi đã dành cả một ngày để đẩy nó vượt xa giới hạn.

Tôi đã thử nghiệm 21 trường hợp sử dụng thiết kế khác nhau, từ mockup UI đến các khung truyện tranh, cho tới việc xóa phông xanh khỏi ảnh chụp màn hình video, và khám phá ra cách nó có thể giúp bạn ngừng lãng phí thời gian.

Tôi đã dùng hết hạn mức tín dụng ba lần và phải chuyển đổi tài khoản Google để tiếp tục thử nghiệm.

Sau đó, tôi đã nâng cấp lên gói trả phí để hoàn thành 21 trường hợp thử nghiệm.

Nano Banana Pro và Gemini 3 Pro Nano Banana Pro được xây dựng trên nền tảng Gemini 3 Pro, mang lại cho nó khả năng suy luận nâng cao và kiến thức về thế giới thực.

Tuyên bố lớn nhất là nó có thể tạo ra hình ảnh với khả năng kết xuất văn bản chính xác — điều mà các trình tạo ảnh AI trước đây đã thất bại.

Tôi muốn xem đây là chiêu trò marketing hay là sự thật.

Cấu trúc thử nghiệm rất đơn giản: bắt đầu với khả năng kết xuất văn bản (tính năng được cho là thay đổi cuộc chơi), chuyển qua các công việc thiết kế chuyên nghiệp, thử nghiệm khả năng chỉnh sửa ảnh, thử các ứng dụng sáng tạo, và kết thúc với những hạn chế mà không ai nói đến.

Vâng, tôi đã khám phá ra những hạn chế của Google Nano Banana Pro, như bạn sẽ thấy ở cuối bài viết.

Trước khi đi vào kết quả, đây là cách để bắt đầu với Google Nano Banana Pro.

Tôi đã chia sẻ kết quả thử nghiệm của mình trong video này, bạn có thể xem tại đây: Google Nano Banana Pro Testing Tutorial

Bắt đầu với Nano Banana Pro

Trang chủ Google Nano Banana Pro Truy cập trang chủ Google Nano Banana Pro.

Bạn sẽ thấy trang chủ với các tính năng và một nút "Try" (Thử). Hãy nhấp vào đó.

Một thông báo xuất hiện cho biết phiên bản Pro đã có sẵn. Nhấp vào "Try it" (Thử ngay) một lần nữa.

Bây giờ bạn đang ở trong giao diện chính. Ô nhập prompt nằm ở trung tâm trang.

  • Menu thả xuống Tools cho phép bạn chọn những gì bạn muốn làm: Deep Research (Nghiên cứu sâu), Create Video using Veo 3 (Tạo video bằng Veo 3), Create Images (Tạo ảnh - cái chúng ta đang dùng), Canvas, và Guided Learning (Học có hướng dẫn).

Giao diện Tools

  • Tùy chọn Model mặc định là "Thinking" (Suy nghĩ), nhưng bạn có thể chuyển sang "Fast" (Nhanh) hoặc "Think with Gemini 3 Pro" (Suy nghĩ với Gemini 3 Pro). Để tạo ảnh với các tính năng của Nano Banana Pro, hãy đặt nó thành Gemini 3 Pro.

Tùy chọn Model

  • Chế độ giọng nói — nút micro — cho phép bạn đọc prompt thay vì gõ.

Chế độ giọng nói

  • Nút dấu cộng trong hộp prompt xử lý việc tải tệp lên. Bạn có thể lấy từ máy tính, Google Drive, Google Photos, hoặc nhập code để làm ngữ cảnh.

Tải tệp lên

Bên dưới ô nhập prompt, có các nút bắt đầu nhanh với các prompt có sẵn. Hữu ích để xem những gì có thể làm được.

Các nút bắt đầu nhanh

Lưu ý: Để sử dụng các tính năng của Nano Banana Pro, hãy chọn "Create Images" trong menu Tools và đặt model của bạn thành Gemini 3 Pro. Nếu không, bạn đang sử dụng phiên bản tiêu chuẩn.

Khi bạn lần đầu nhấp vào liên kết thử, nó sẽ mở ra với một prompt mặc định:

Prompt mặc định

Create a comic with the title: Getting started with Nano Banana Pro 🍌. 
Panel 1: A mobile interface on Gemini, rendered in a poetic watercolor-ink 
style with fine ink outlines and soft, bleeding washes. 
The interface is friendly and a hand painted with expressive brushwork 
taps a prominent button labeled “🍌 Create image”.
 Above the button it should say “Choose your Model” then below there should be
 a checkbox that says “Thinking with 3 Pro”  Muted greys and blues dominate the background. The button has a vivid yellow accent. “ Select the Thinking with 3 Pro model” and tap "Create image" to begin. Panel 2: A cheerful person is depicted adding their selfie from the phone’s camera. The user's face is drawn with soft outlines and warm pastel colors, while the phone and UI maintain the delicate water-ink aesthetic. Visible paper grain adds to the texture. Panel 3: The person thinks about what to create. In the background, different options are visualized to show what they’re thinking, including — them as a plushie, them with a mohawk hairstyle, and a figurine. These options are clearly rendered behind the person in the same style as the rest of the comic. Panel 4: The person is shown adding a style prompt, with a speech bubble saying “Transform me into a watercolor painting”. The text is integrated into the panel's watercolor-ink look, and the interaction feels natural and intuitive. Panel 5: The person is seen editing the image by simply typing into Gemini. The scene captures the ease of this interaction, with the final edited image, now in a watercolor style, appearing on the screen. The overall tone is friendly, instructional, and inspiring. It feels like a mini tutorial comic, all conveyed through the specified delicate water-ink illustration style. Make the aspect ratio 16:9.

Kết quả từ prompt mặc định Nó tạo ra một khung truyện tranh ngay lập tức.

Bây giờ hãy xem thứ này có thể làm được gì.

Tôi đã cấu trúc các bài kiểm tra từ đơn giản đến phức tạp, bắt đầu với tính năng mà mọi người đang bàn tán.

Kết xuất văn bản

Hầu hết các mô hình ảnh AI đều tạo ra chữ vô nghĩa khi bạn yêu cầu văn bản trong hình ảnh.

Nano Banana Pro được xây dựng trên Gemini 3 Pro, vì vậy nó hiểu văn bản có nghĩa là gì và nó nên trông như thế nào.

Thử nghiệm 1: Typography biểu cảm

Tôi bắt đầu với typography biểu cảm.

Prompt: Tạo 6 logo tối giản, mỗi logo là một từ biểu cảm: whisper (thì thầm), explode (nổ tung), drip (nhỏ giọt), bounce (nảy), freeze (đóng băng), melt (tan chảy). Làm cho các chữ cái thể hiện trực quan ý nghĩa của mỗi từ một cách ấn tượng. Bố cục: kết xuất vector phẳng của tất cả các logo màu đen trên một nền trắng duy nhất.

Kết quả typography biểu cảm Kết quả có ngay lập tức.

"Whisper" xuất hiện với những đường nét mỏng manh, tinh tế — gần như không nhìn thấy, giống như một lời thì thầm thực sự. "Explode" có năng lượng tỏa ra ngoài với những mảnh vỡ sắc nhọn bung ra từ trung tâm.

"Drip" nhỏ giọt xuống với những giọt nước rơi từ các chữ cái. "Bounce" cho thấy các đường chuyển động biểu thị năng lượng nảy lên.

"Freeze" có các cạnh lởm chởm, kết tinh. "Melt" chảy đọng ở phía dưới như thể nó đang tan chảy.

Nó hiểu ý nghĩa và thể hiện nó một cách trực quan.

Thử nghiệm 2: Kết xuất văn bản trong thiết kế kiến trúc

Prompt: Cảnh một con phố hiện đại ở Tokyo vào một ngày nắng đẹp. Các tòa nhà có hình dạng độc đáo giống như các chữ cái拼写 ra TOKYO với màu đỏ, trắng và xanh dương tươi sáng. Các tòa nhà vẫn trông giống như tòa nhà, và sự giống nhau với các chữ cái chỉ là tinh tế.

Kết quả kiến trúc chữ Các tòa nhà tạo thành chữ T-O-K-Y-O trong khi vẫn có vẻ là kiến trúc hợp pháp.

Chữ "T" — các tòa nhà cao tầng màu trắng với điểm nhấn màu đỏ. Chữ "O" — một cấu trúc kính cong. Chữ "K" và "Y" — các tòa nhà góc cạnh với mặt tiền màu xanh và trắng. Chữ "O" cuối cùng — một tòa nhà tròn màu đỏ.

Ô tô, người và cây cối ở tầng trệt. Một cảnh quan thành phố hoàn chỉnh, đáng tin cậy mà tình cờ lại拼写 ra chữ TOKYO.

Sau đó, tôi đã thử nghiệm khả năng đa ngôn ngữ.

Thử nghiệm 3: Văn bản đa ngôn ngữ

Prompt: “Tạo một poster quán cà phê hiện đại với dòng chữ FRESH BREW DAILY bằng tiếng Anh, sau đó dịch nó sang tiếng Swahili trong khi vẫn giữ nguyên thẩm mỹ thiết kế.”

Kết quả poster đa ngôn ngữ Thiết kế được duy trì — cùng màu sắc, bố cục, phong cách typography.

Bản dịch có nội dung “KAHAWA MPYA KILA SIKU” (Cà phê tươi mỗi ngày trong tiếng Swahili) với khẩu hiệu “Fungua Kila Asbuhi” (Mở cửa mỗi sáng).

Nhưng đây là vấn đề: bản dịch là dịch trực tiếp, không nhất thiết là cách một đội ngũ marketing bản địa sẽ sử dụng. Việc dịch hình ảnh hoạt động tốt. Ngôn ngữ thực tế cần có người xác minh.

Sau đó, tôi đã đạt đến giới hạn tín dụng đầu tiên.

Thông báo: “Bạn đã đạt đến giới hạn Nano Banana Pro của mình. Hình ảnh sẽ được tạo bằng phiên bản trước đó cho đến khi giới hạn của bạn được đặt lại vào ngày 23 tháng 11, 2:10 chiều. Bạn có thể nâng cấp bất cứ lúc nào để có giới hạn cao hơn.

Chỉ sau ba lần thử nghiệm.

Tôi đã chuyển sang một tài khoản Google khác để tiếp tục. Một giải pháp tạm thời, nhưng nó cho thấy sự hạn chế về tín dụng trên gói miễn phí.*

Thử nghiệm 4: Thiết kế UI ứng dụng di động

Prompt:Thiết kế giao diện ứng dụng di động hiện đại cho một ứng dụng theo dõi thể dục. Hiển thị màn hình chính với các chỉ số hàng ngày, một vòng tròn tiến độ, các nút tập luyện và một thanh điều hướng dưới cùng. Sử dụng thiết kế tối giản, sạch sẽ với tông màu tím và trắng. Bao gồm văn bản và biểu tượng UI thực tế.”

Một điều bất ngờ đã xảy ra.

Kết quả UI ứng dụng di động Nó đã tạo ra một ứng dụng React hoàn chỉnh với code hoạt động. Component đầy đủ với hook useState, tạo kiểu bằng Tailwind CSS, xem trước trực tiếp hiển thị ứng dụng thể dục.

Tôi muốn một hình ảnh để chia sẻ với nhóm của mình, không phải code.

Prompt tiếp theo: “Bạn có thể tạo một hình ảnh thay thế không?”

Kết quả hình ảnh UI Bây giờ tôi đã có cùng một thiết kế dưới dạng một hình ảnh độ phân giải cao.

Điều này cho thấy Nano Banana Pro có thể cung cấp cho bạn cả code hoạt động và hình ảnh tĩnh. Nếu bạn là một nhà phát triển, bạn sẽ có được code chức năng. Nếu bạn là một nhà thiết kế hoặc quản lý sản phẩm, bạn sẽ có được các mockup bóng bẩy để chia sẻ.

Giao diện hiển thị: vòng tròn tiến độ gradient màu tím ở mức 7.4%, typography sạch sẽ cho các chỉ số, thiết kế biểu tượng phù hợp cho số bước/calo/nhịp tim, các nút loại hình tập luyện với biểu tượng và thanh điều hướng dưới cùng chuyên nghiệp.

Thử nghiệm 5: Bảng điều khiển phân tích UI thiết kế web.

Cái này không suôn sẻ lắm.

Tôi đã phải lặp lại prompt vì nó liên tục tạo ra các hình ảnh kiểu mockup với kích thước sai.

Prompt đã tinh chỉnh: “Tạo một UI trang web bảng điều khiển phân tích đẹp mắt cho một công cụ quản lý mạng xã hội, hiển thị các biểu đồ về chỉ số tương tác, tăng trưởng người theo dõi và các bài đăng hoạt động tốt nhất. Sử dụng chủ đề tối với các màu nhấn là xanh mòng két và cam. Tôi muốn nó ở dạng hình ảnh, UI/UX mà tôi có thể chia sẻ với nhà phát triển của mình để lập trình bảng điều khiển này thành một ứng dụng web thực sự. Không cung cấp mockup. Tôi cần UI trang bảng điều khiển web thực tế, mà tôi sẽ sử dụng để lập trình. Không cung cấp code, chỉ cung cấp hình ảnh bảng điều khiển sáng tạo phù hợp với nhu cầu của tôi.”

Kết quả bảng điều khiển phân tích Bốn chỉ số chính ở trên cùng với các đường viền màu hiển thị Tổng số tương tác.

Một biểu đồ tương tác theo thời gian. Biểu đồ tròn về nhân khẩu học người theo dõi. Biểu đồ cột tăng trưởng theo nền tảng. Bảng các bài đăng hoạt động tốt nhất với hình thu nhỏ và các chỉ số.

Tôi đã thử nghiệm chế độ sáng: “Cho tôi phiên bản chế độ sáng.”

Kết quả chế độ sáng Cùng một bố cục, nền trắng sạch sẽ thay vì tối.

Sau đó tôi lại dùng hết hạn mức tín dụng.

Đánh giá của tôi: những thiết kế này phù hợp cho các bài thuyết trình ý tưởng và giải thích các ý tưởng rộng cho khách hàng. Chúng cho thấy một bảng điều khiển có thể trông như thế nào và giúp hình dung cấu trúc dữ liệu. Chúng không phải là các thiết kế hoàn hảo đến từng pixel, sẵn sàng cho sản xuất.

Bạn vẫn cần nhiều lần lặp lại để có được các chi tiết cụ thể — khoảng cách chính xác, màu sắc chính xác, mối quan hệ dữ liệu phù hợp, hành vi đáp ứng, trạng thái tương tác.

Thử nghiệm 6: Thiết kế nhận diện thương hiệu

Prompt: “Tạo một bộ nhận diện thương hiệu cho một quán cà phê tên là Bean & Brew, bao gồm: các biến thể logo, bảng màu, mockup danh thiếp và thiết kế bao bì cốc cà phê. Tất cả trên một bảng trình bày duy nhất.”

Kết quả nhận diện thương hiệu Nó đã tạo ra logo huy hiệu tròn với hạt cà phê và lá (EST. 2023), wordmark ngang “BEAN & BREW”, biểu tượng lá đơn giản hóa, năm mẫu màu với mã hex (Nâu Espresso, Latte Kem, Xanh Rừng, Đất nung ấm, Xám Than), thiết kế danh thiếp với họa tiết hạt cà phê, nhiều kích cỡ cốc (8oz, 12oz, 16oz) với logo, túi cà phê với thiết kế nhãn.

Được trình bày trên nền bảng gỗ bần với hạt cà phê và kết cấu vải bố rải rác xung quanh.

Những gì thường mất nhiều ngày — các biến thể logo, nghiên cứu bảng màu, bố cục danh thiếp, thiết kế bao bì, trình bày hướng dẫn thương hiệu — được thực hiện trong vài giây.

Một nhà thiết kế chuyên nghiệp có sử dụng nguyên bản cái này không? Không.

Nhưng là một điểm khởi đầu cho một chủ doanh nghiệp nhỏ, dự án sinh viên hoặc bài thuyết trình chào hàng, điều này có thể rất giá trị.

Thử nghiệm 7: Infographic giáo dục

Prompt:Tạo một infographic về Voi châu Phi, tập trung vào môi trường sống, tình trạng bảo tồn và những sự thật thú vị về hành vi xã hội của chúng.”

Kết quả infographic về voi Nó đã tạo ra một infographic với ba phần chính: Môi trường sống & Phạm vi (bản đồ châu Phi với các vùng được mã hóa màu cho rừng, thảo nguyên, sa mạc, nguồn nước), Tình trạng bảo tồn (thước đo Sách đỏ IUCN từ dễ bị tổn thương đến nguy cấp, các biểu tượng cho thấy các mối đe dọa như săn trộm và mất môi trường sống, các nỗ lực bảo tồn với hình ảnh kiểm lâm), Hành vi xã hội (ba họa tiết tròn cho xã hội mẫu hệ, giao tiếp phức tạp bằng hạ âm, mối quan hệ gia đình bền chặt và allomothering - chăm sóc con non bởi các thành viên khác trong đàn).

Một infographic giáo dục hoàn chỉnh, sẵn sàng để chia sẻ. Với tông màu đất ấm áp, các họa tiết viền lấy cảm hứng từ châu Phi, phong cách hình ảnh mạch lạc.

Gemini đã hiểu các mối quan hệ logic. Môi trường sống ảnh hưởng đến các thách thức bảo tồn, điều này kết nối với lý do tại sao cấu trúc xã hội lại quan trọng đối với sự sống còn của loài.

Thử nghiệm 8: Thông tin thời gian thực

Prompt: “Tạo một infographic phong cách pop-art sống động hiển thị thời tiết hôm nay ở Nairobi với nhiệt độ, điều kiện và dự báo 3 ngày.”

Kết quả infographic thời tiết Nó đã lấy dữ liệu thời tiết thực tế và tạo kiểu cho nó như một báo cáo thời tiết trong truyện tranh.

Màu sắc pop-art đậm — đỏ, xanh, vàng, với các chấm halftone. “THỜI TIẾT NAIROBI HÔM NAY!” với đường chân trời thành phố đầy màu sắc. Điều kiện hiện tại: 22°C (cảm giác như 25°C), mưa nhẹ 42% khả năng, gió 12 mph đông bắc.

Dự báo ba ngày: Chủ nhật, 23/11 (mưa nhẹ, cao 23°C, thấp 15°C), Thứ hai, 24/11 (mưa nhẹ, cao 26°C, thấp 15°C), Thứ ba, 25/11 (có khả năng mưa rào, cao 25°C, thấp 16°C).

Các hiệu ứng âm thanh kiểu truyện tranh “ZAP!” và “POP!” được thêm vào để tăng tính thẩm mỹ.

Bạn có thể tạo nội dung mà không cần nhập dữ liệu—đồ họa thời tiết hàng ngày, tỷ số thể thao thời gian thực, cập nhật thị trường chứng khoán — bất cứ thứ gì cần thông tin hiện tại.

Thử nghiệm 9: Thử nghiệm trực quan hóa công thức

Prompt: “Tạo một infographic từng bước hướng dẫn cách làm Ugali, một món ăn truyền thống của Kenya, với các thành phần và hướng dẫn nấu ăn.”

Kết quả infographic công thức Nó đã làm đúng công thức.

Phần Nguyên liệu & Dụng cụ: Bột ngô (tỷ lệ nước:bột là 2:1), nước, Sufuria (nồi lớn), Mwiko (muỗng gỗ).

Bốn bước nấu ăn với hình minh họa: Đun sôi nước trong Sufuria, Thêm bột trong khi khuấy để tránh vón cục, Khuấy và miết hỗn hợp vào thành nồi cho đến khi đặc lại, Tạo hình và nấu cho đến khi nó cứng lại và không dính vào nồi.

Nó biết tên tiếng Swahili chính xác cho các dụng cụ nấu ăn, tỷ lệ 2:1 truyền thống, kỹ thuật khuấy cụ thể để tránh vón cục, và cách Ugali được phục vụ và ăn theo truyền thống.

Khả năng chỉnh sửa ảnh

Tôi muốn thử nghiệm các trường hợp sử dụng thực tế cho người sáng tạo nội dung.

Đầu tiên là xóa phông xanh. Tôi đã chụp một ảnh màn hình từ cảnh quay thô của mình — tôi đang ngồi trước một phông xanh với một bộ micro.

Ảnh gốc với phông xanh

Prompt: “Xóa nền khỏi hình ảnh này và đặt chủ thể trên nền gradient hiện đại với ánh sáng dịu.”

Kết quả xóa phông xanh Xóa nền sạch sẽ. Phông xanh đã biến mất hoàn toàn, được thay thế bằng một gradient từ xanh dương sang tím sang cam.

Việc phát hiện cạnh xung quanh tôi, chiếc ghế và tay micro rất tốt—không có vệt xanh, tách biệt rõ ràng.

Đối với những người sáng tạo nội dung quay phim trên phông xanh, điều này tiết kiệm hàng giờ đồng hồ. Sử dụng nó cho hình ảnh tĩnh hoặc thumbnail thay vì phải key phông xanh.

Thử nghiệm tiếp theo.

Prompt:Bạn có thể làm cho nó thành nền trắng với sự pha trộn xuyên tâm ở giữa màu trắng và màu #f2f2f2 không?

Kết quả nền trắng Nền trắng sạch sẽ với gradient xuyên tâm tinh tế — trung tâm màu trắng sáng mờ dần sang màu xám nhạt ở các cạnh.

Chất lượng nền chụp ảnh sản phẩm chuyên nghiệp hoặc ảnh chân dung công ty.

Thử nghiệm 11: Xóa đối tượng

Tôi tìm thấy một hình ảnh trên Unsplash — sáu người đang ngắm hoàng hôn trên đỉnh đồi, giơ tay lên.

Ảnh gốc để xóa đối tượng

Prompt: “Xóa người thứ ba từ bên trái trong hình ảnh này và lấp đầy nền.”

Kết quả xóa đối tượng lần 1 Người đó đã được xóa, và hoàng hôn, núi non, và bầu trời đã được lấp đầy. Nhưng có một khoảng trống rõ ràng trong nhóm. Khoảng cách trông không tự nhiên.

Prompt tiếp theo: “Bạn đã xóa nhưng để lại một khoảng trống. Bạn có thể kéo những người khác lại gần nhau trong ảnh để làm cho nó trông chuyên nghiệp hơn mà không có khoảng trống của người bạn đã xóa và hợp nhất nó không?

Kết quả xóa đối tượng lần 2 Khoảng trống đã được lấp đầy, và nhóm trông gắn kết hơn. Nhưng nếu bạn nhìn vào người ở ngoài cùng bên phải, tư thế của họ đã bị thay đổi.

Việc xóa đối tượng không hoàn hảo. Nó đòi hỏi nhiều lần lặp lại.

Đối với việc xóa đơn giản, điều này hoạt động tốt. Các chỉnh sửa phức tạp liên quan đến con người đòi hỏi nhiều lần lặp lại và có thể cần chỉnh sửa thủ công.

Thử nghiệm 12: Chuyển đổi phong cách

Tôi lấy một bức chân dung từ Unsplash.

Ảnh chân dung gốc

Prompt:Biến bức ảnh này thành một bức tranh minh họa pop art sống động với màu sắc đậm và đường viền kiểu truyện tranh, tương tự như tác phẩm của Andy Warhol.”

Kết quả chuyển đổi phong cách Từ một bức chân dung bình thường thành một tác phẩm pop art đáng để trưng bày.

Mái tóc màu cam-đỏ tươi với đường viền đen đậm. Khuôn mặt có chất lượng đồ họa phẳng và đổ bóng bằng chấm halftone. Đôi môi đỏ đậm, các đường nét rõ ràng. Mực vẽ kiểu truyện tranh. Bảng màu pop art đặc trưng — nền vàng, điểm nhấn màu xanh mòng két. Họa tiết chấm halftone tạo cảm giác như in lụa.

Sự chuyển đổi phong cách này sẽ mất hàng giờ trong Photoshop với nhiều bộ lọc, điều chỉnh thủ công và kỹ năng nghệ thuật.

Thử nghiệm 13: Thử nghiệm tạo truyện tranh

Prompt:Tạo một khung truyện tranh duy nhất cho thấy một siêu anh hùng đang đứng trên sân thượng nhìn ra thành phố Nairobi lúc hoàng hôn, với ánh sáng ấn tượng và nét mực đậm. Bao gồm một bong bóng thoại nói rằng Thành phố cần tôi.

Kết quả khung truyện tranh Siêu anh hùng mặc áo choàng trong tư thế ngồi xổm ấn tượng trên mép sân thượng.

Nền là đường chân trời của Nairobi với tháp KICC. Hoàng hôn với bầu trời màu cam và tím. Nét mực truyện tranh đậm với bóng đổ dày. Bong bóng thoại với dòng chữ “THE CITY NEEDS ME.” rõ ràng, dễ đọc.

Văn bản trong bong bóng thoại có thể đọc được. Bố cục tuân theo khung hình truyện tranh phù hợp. Phong cách nghệ thuật nhất quán.

Hữu ích cho việc tạo storyboard cho truyện tranh trước khi thực hiện bản vẽ cuối cùng, tạo tài liệu tham khảo hình ảnh nhanh cho các họa sĩ, tạo concept art cho tiểu thuyết đồ họa và làm nội dung mạng xã hội theo phong cách truyện tranh.

Thử nghiệm 14: Bảng thiết kế nhân vật

Prompt:Tạo một bảng thiết kế nhân vật cho một nhân vật chính trong trò chơi điện tử: một nhà phát minh trẻ tuổi am hiểu công nghệ với kính bảo hộ và một đai dụng cụ. Hiển thị góc nhìn chính diện, góc nhìn bên và góc nhìn sau trên một nền trắng duy nhất với nét vẽ sạch sẽ.

Kết quả bảng thiết kế nhân vật Nó đã tạo ra một nhân vật tên là “KIDA” — một nhà phát minh trẻ tuổi am hiểu công nghệ. Ba góc nhìn: chính diện (cho thấy kính bảo hộ trên đầu, tóc nhọn, đai dụng cụ với các tiện ích, quần cargo, ủng nặng), góc nhìn bên (hồ sơ và vị trí đai dụng cụ, kính bảo hộ từ bên cạnh), góc nhìn sau (thiết kế ba lô, cách sắp xếp dụng cụ trên đai từ phía sau). Một người bạn đồng hành robot nhỏ ở chân cô ấy.

Các nhà phát triển game cần điều này để tạo mô hình 3D. Các nhà làm phim hoạt hình sử dụng nó để đảm bảo tính nhất quán của nhân vật. Các nghệ sĩ concept tạo ra nó để giới thiệu nhân vật.

Nét vẽ sạch sẽ, tỷ lệ nhất quán qua ba góc nhìn, nền trắng sẵn sàng để tham khảo.

Đối với các nhà phát triển game độc lập hoặc sinh viên hoạt hình, loại bảng thiết kế nhân vật này mất hàng giờ hoặc hàng ngày.

Thử nghiệm 15: Thử nghiệm Concept Art

Prompt:Tạo concept art cho một thành phố châu Phi tương lai vào năm 2075, cho thấy các tòa nhà chọc trời bóng bẩy pha trộn với các yếu tố kiến trúc truyền thống, các phương tiện bay và các khu vườn thẳng đứng tươi tốt. Phong cách quang thực với ánh sáng hoàng hôn ấn tượng.”

Kết quả concept art thành phố tương lai Nó đã tạo ra các tòa nhà chọc trời tương lai bóng bẩy với các tấm pin mặt trời và mặt tiền bằng kính. Các yếu tố kiến trúc truyền thống của châu Phi — các cấu trúc hình nón gợi nhớ đến những túp lều truyền thống được kết hợp vào các tòa nhà hiện đại.

Các phương tiện bay — VTOL và tàu đệm khí trên bầu trời. Các khu vườn thẳng đứng tươi tốt đổ xuống các tòa nhà. Hoạt động ở tầng trệt với con người, xe điện và không gian xanh. Ánh sáng hoàng hôn ấn tượng tạo ra tông màu vàng ấm áp.

Các đặc điểm kiến trúc riêng lẻ có thể nhìn thấy. Kết cấu trên các tòa nhà. Sự tích hợp giữa thiên nhiên và công nghệ. Các yếu tố văn hóa được đan xen vào thiết kế tương lai.

Điều này xuất hiện trong các bộ tài liệu giới thiệu phim khoa học viễn tưởng, tài liệu thiết kế trò chơi điện tử, portfolio kiến trúc cho thiết kế phỏng đoán và các triển lãm nghệ thuật.

Thử nghiệm 16: Thumbnail YouTube

Prompt:Thiết kế một thumbnail YouTube cho video có tiêu đề Tôi đã thử nghiệm Trình tạo ảnh AI mới của Google. Bao gồm lớp phủ văn bản ấn tượng, màu sắc tương phản đỏ và xanh, và một vị trí giữ chỗ cho biểu cảm khuôn mặt phấn khích. Tỷ lệ khung hình 16:9.”

Kết quả thumbnail YouTube Nó đã tạo ra thumbnail dễ nhấp này với thiết kế chia đôi màn hình: Bên trái màu đỏ với chữ “I TESTED” (TÔI ĐÃ THỬ) màu trắng đậm, sờn, nhãn “OLD AI” (AI CŨ) và một biểu cảm sốc.

Bên phải màu xanh với chữ “NEW AI!” (AI MỚI!) màu vàng đậm, bên dưới là “GOOGLE’S NEW AI!” (AI MỚI CỦA GOOGLE!), biểu cảm phấn khích. Chữ “VS.” lớn kết nối hai bên.

Nó sử dụng các phương pháp hay nhất cho thumbnail YouTube: màu sắc có độ tương phản cao nổi bật trong các feed, văn bản đậm, dễ đọc ngay cả ở kích thước nhỏ, khuôn mặt thể hiện cảm xúc rõ ràng, một thiết lập so sánh rõ ràng tạo ra sự tò mò và tỷ lệ khung hình 16:9 hoàn hảo.

Người sáng tạo nội dung dành hàng giờ cho thumbnail vì chúng rất quan trọng đối với tỷ lệ nhấp chuột.

Thử nghiệm 17: Carousel trên Instagram

Prompt: Tạo một mẫu bài đăng carousel trên Instagram cho 5 Công cụ AI mà mọi người sáng tạo cần. Thiết kế 5 slide với tiêu đề được đánh số, mô tả ngắn gọn và nền gradient phù hợp. Phong cách hiện đại, bắt mắt.”

Kết quả carousel Instagram Nó đã tạo ra năm slide Instagram sẵn sàng để đăng với thương hiệu nhất quán.

Slide 1 — ChatGPT: Gradient từ xanh dương sang tím, “Đối tác động não sáng tạo của bạn.” Slide 2 — Canva AI: Gradient từ tím sang xanh lơ, “Phép thuật thiết kế cho mọi người.” Slide 3 — Descript: Gradient từ xanh lơ sang xanh lá mạ, “Chỉnh sửa video trở nên đơn giản.” Slide 4 — Midjourney: Gradient từ xanh lá mạ sang vàng với điểm nhấn màu tím, “Nghệ thuật AI từ trí tưởng tượng.” Slide 5 — Buffer AI Assistant: Gradient từ vàng sang cam sang đỏ, “Lên lịch và chiến lược thông minh.”

Thiết kế mạch lạc — cùng phong cách typography, cùng cấu trúc bố cục, chuyển đổi gradient mượt mà giữa các slide.

Người sáng tạo nội dung có thể đăng ngay lập tức. Thông tin rõ ràng, thiết kế hiện đại và được định dạng cho tính năng carousel của Instagram.

Thử nghiệm 18: Poster sự kiện

Prompt:Tạo một poster sự kiện hiện đại cho Hội nghị thượng đỉnh Đổi mới Công nghệ 2025 diễn ra tại Nairobi vào ngày 15 tháng 12. Bao gồm chi tiết sự kiện, địa điểm, thời gian và một vị trí giữ chỗ cho mã QR. Sử dụng typography đậm và thiết kế lấy cảm hứng từ công nghệ.

Kết quả poster sự kiện Nó đã tạo ra một poster sự kiện chuyên nghiệp với tiêu đề: “TECH INNOVATION SUMMIT 2025” (HỘI NGHỊ THƯỢNG ĐỈNH ĐỔI MỚI CÔNG NGHỆ 2025) với khẩu hiệu “NAIROBI: SHAPING THE FUTURE.” (NAIROBI: ĐỊNH HÌNH TƯƠNG LAI).

Các chủ đề: AI & Tự động hóa, Biên giới Fintech, Điện toán đám mây, An ninh mạng, Cơ sở hạ tầng số. Chi tiết sự kiện: Ngày (15 tháng 12, 2025), Địa điểm (TRUNG TÂM TRIỂN LÃM SARIT, NAIROBI), Thời gian (9:00 sáng — 5:00 chiều). Mã QR với dòng chữ “QUÉT ĐỂ ĐĂNG KÝ & XEM LỊCH TRÌNH.”

Thiết kế có bản đồ kỹ thuật số của châu Phi với các họa tiết mạch điện, nền tối với đồ họa công nghệ màu xanh mòng két và tím, và typography hiện đại, sạch sẽ.

Có thể sử dụng để quảng bá trên mạng xã hội, email marketing, poster in, trang web sự kiện. Chất lượng đủ tốt cho cửa hàng in ấn hoặc các chiến dịch marketing kỹ thuật số.

Hạn chế của Nano Banana

Hãy nói về những hạn chế mà tôi đã phát hiện ra.

Thử nghiệm 19: Chi tiết khuôn mặt nhỏ

Prompt:Tạo một bức ảnh nhóm rộng của 20 người tại một lễ cưới, tất cả đều nhìn về phía máy ảnh với các đặc điểm và biểu cảm khuôn mặt rõ ràng.

Kết quả ảnh nhóm Nhìn lướt qua: cảnh cưới đẹp. Địa điểm là một nhà kho mộc mạc với tường đá. Trang trí vòm hoa và đèn dây. Hai mươi người trong trang phục cưới. Ánh sáng tự nhiên ngoài trời. Băng rôn “CONGRATULATIONS” (CHÚC MỪNG). Mọi người đều nhìn về phía máy ảnh, mỉm cười, ăn mặc đẹp.

Phóng to vào các khuôn mặt.

Ở kích thước đầy đủ, các khuôn mặt trông ổn. Phóng to và bạn sẽ nhận thấy những sai sót. Một số khuôn mặt thiếu chi tiết nhỏ. Các đặc điểm khuôn mặt trở nên mềm hoặc mờ ở một số chỗ.

Tài liệu có đề cập đến điều này: “nó vẫn có thể gặp khó khăn với các khuôn mặt nhỏ, chính tả chính xác và các chi tiết nhỏ trong hình ảnh.”

Thử nghiệm 20: Độ chính xác của văn bản phức tạp

Prompt:Tạo một trang nhất của một tờ báo với tiêu đề, Hội nghị thượng đỉnh AI toàn cầu kết thúc, và ba cột văn bản bài báo có thể đọc được về các phát triển AI gần đây.

Kết quả trang báo Nó đã tạo ra một bố cục báo ấn tượng với một tiêu đề hoàn hảo: đầu báo “THE GLOBAL HERALD”, “HỘI NGHỊ THƯỢNG ĐỈNH AI TOÀN CẦU KẾT THÚC” được in đậm. Bố cục chuyên nghiệp: Nhiều cột, ảnh từ hội nghị thượng đỉnh, các phần bài báo cho “Các thỏa thuận mới về AI có đạo đức,” “Những đột phá trong mô hình hóa khí hậu,” “Chẩn đoán y tế được hỗ trợ bởi AI.”

Nhưng có một vấn đề.

Văn bản trông dễ đọc từ xa. Thử đọc các đoạn văn, và bạn sẽ thấy vấn đề. Các từ bị sai chính tả. “AI-powered” có thể được kết xuất thành “AI-owered” mà không có chữ P.

Đối với các mockup, bài thuyết trình và các khái niệm trực quan mà mọi người sẽ không đọc chữ nhỏ, nó hoàn hảo, nhưng đối với các ấn phẩm thực tế, nó không tốt.

Thử nghiệm 21: Độ chính xác của thông tin

Prompt:Tạo một infographic so sánh thị phần của các thương hiệu điện thoại thông minh vào năm 2025 với tỷ lệ phần trăm chính xác và logo thương hiệu.

Kết quả infographic thị phần Nó đã tạo ra một infographic chuyên nghiệp có tiêu đề “THỊ PHẦN ĐIỆN THOẠI THÔNG MINH TOÀN CẦU THEO THƯƠNG HIỆU — THÁNG 10 NĂM 2025.”

Hiển thị: Apple (27.04%), Samsung (20.32%), Không xác định (11.1%), Xiaomi (10.23%), Vivo (6.41%), Oppo (5.66%), Khác (19.24%). Trích dẫn nguồn: “Dựa trên dữ liệu Thị phần nhà cung cấp di động toàn cầu từ StatCounter Global Stats.” Biểu đồ cột và biểu đồ tròn để so sánh trực quan.

Câu hỏi bây giờ là: Những con số này có chính xác không?

Google cảnh báo trong tài liệu: “Kiến thức về thế giới thực của mô hình rất rộng nhưng không phải là không thể sai lầm. Khi tạo infographic, chú thích sơ đồ hoặc biểu diễn dữ liệu phức tạp, nó có thể hiểu sai thông tin hoặc tạo ra kết quả không chính xác. Luôn xác minh các kết quả dựa trên dữ liệu.”

Infographic trông chuyên nghiệp và có thẩm quyền. Bạn cần kiểm tra lại những con số đó trước khi sử dụng chúng trong các bài thuyết trình hoặc báo cáo thực tế.

Vấn đề chi phí

Tôi đã dùng hết hạn mức tín dụng nhiều lần trong quá trình thử nghiệm. Vào cuối phiên làm việc, tôi muốn biết mình đã chi bao nhiêu token.

Tôi đã hỏi: “Chi phí cho tất cả công việc của tôi hôm nay là bao nhiêu?”

Phản hồi giải thích: Vì tôi đang sử dụng nền tảng, việc sử dụng được bao gồm trong gói miễn phí hoặc gói đăng ký (Google AI Pro), không phải trên cơ sở trả tiền theo token. Nếu tôi có một gói đăng ký trả phí, đó sẽ là một khoản phí cố định hàng tháng, không dựa trên số lượng token riêng lẻ.

Câu trả lời này không rõ ràng.

Tôi đã tìm kiếm thông tin về chi phí: trang quản lý đăng ký, tìm kiếm trong các menu, kiểm tra trang hoạt động hiển thị các hình ảnh đã tạo và dòng thời gian.

Trang hoạt động Không có cách nào rõ ràng để xem chi phí thực tế hoặc việc sử dụng token.

Trang hoạt động cho thấy những gì bạn đã tạo và khi nào bạn tạo nó: không có phân tích chi phí, không có bộ đếm token, không có cấu trúc giá cả rõ ràng.

Đối với việc sử dụng chuyên nghiệp, điều này đáng lo ngại. Bạn cần biết: còn lại bao nhiêu tín dụng, mỗi lần tạo tốn bao nhiêu, số tiền chi tiêu hàng tháng và khi nào giới hạn được đặt lại.

Khi tôi hỏi lại trong cùng một luồng, nó đã tạo ra một máy tính chi phí bằng React, điều mà tôi nghĩ là điên rồ:

Máy tính chi phí React Cuối cùng, tôi không thích việc khi tôi chỉnh sửa prompt gốc, tôi không thể theo dõi cuộc trò chuyện trước đó.

Nó xóa sạch mọi thứ, một điều tôi cũng đã thấy trên Claude.

Mất lịch sử chỉnh sửa

Suy nghĩ cuối cùng

Nano Banana Pro giúp bạn tiết kiệm thời gian, nhưng nó cần một sự xem xét kỹ lưỡng đối với tất cả các hình ảnh mà nó tạo ra.

Bạn vẫn cần biết cái gì trông đẹp, hiểu các nguyên tắc thiết kế, lặp lại ý tưởng, có tầm nhìn sáng tạo, kiểm tra thông tin, chỉnh sửa và tinh chỉnh kết quả.

Nếu bạn có ý tưởng nhưng thiếu kỹ năng Photoshop hoặc cần hình dung các khái niệm một cách nhanh chóng, đây là một công cụ có giá trị.

Những gì hoạt động tốt: Kết xuất và tích hợp văn bản trong hình ảnh. Mockup và nguyên mẫu thiết kế nhanh. Tài liệu marketing. Chỉnh sửa ảnh và chuyển đổi phong cách. Infographic giáo dục và trực quan hóa dữ liệu. Concept art và công việc sáng tạo. Tạo nhiều biến thể nhanh chóng.

Những gì không hoạt động tốt: Các chi tiết nhỏ trong các cảnh phức tạp (khuôn mặt nhỏ, họa tiết phức tạp). Văn bản dài có thể đọc được (đoạn văn, bài báo). Độ chính xác tuyệt đối của thông tin (luôn xác minh dữ liệu). Các đặc điểm nhân vật nhất quán trong một số trường hợp.

Nhìn chung, đây là một trình tạo ảnh AI ấn tượng, một trong những trình tạo tốt nhất mà tôi đã thử nghiệm cho công việc thực tế, chuyên nghiệp.

Tôi vẫn đang khám phá các khả năng của Nano Banana Pro. Sẽ có thêm nhiều thử nghiệm trong những ngày tới. Bạn dự định tạo ra gì với nó? Hãy chia sẻ kinh nghiệm của bạn trong phần bình luận.

Theo dõi trên X

Joe Njenga

Bài đăng liên quan