O GPT-4o da OpenAI é, sem dúvida, uma estrela brilhante no rápido desenvolvimento do domínio da IA. As suas poderosas capacidades multimodais permitem aos utilizadores gerar imagens espantosas a partir de simples descrições de texto. Neste artigo, vamos levá-lo a um mergulho profundo nas capacidades de geração de imagens do GPT-4o e partilhar uma série de sugestões úteis que o ajudarão a passar de um principiante a um mestre das sugestões.
Dominar os princípios básicos da geração de imagens GPT-4o
As capacidades de geração de imagens do GPT-4o vão muito além do simples texto para imagem. Incorpora tecnologia avançada de IA para compreender contextos complexos, expressões emocionais subtis e requisitos visuais detalhados. De acordo com a informação recolhida, o GPT-4o tem as seguintes caraterísticas significativas na geração de imagens:
Pode analisar simultaneamente texto, imagem e entrada de áudio para captar com precisão a intenção criativa; suporta comandos complexos de palavras-chave para produzir rapidamente imagens de alta qualidade; gera uma vasta gama de expressões artísticas, desde o estilo Ghibli ao estilo de peluche 3D; processamento natural e credível de espaço, perspetiva, luz e sombra; suporte para criação secundária da imagem gerada, como substituição de fundo e modificação de detalhes; e velocidade de resposta rápida, adequada para tempo real Tempo de resposta rápido, adequado para iteração criativa em tempo real.
Para escrever uma boa mensagem, é necessário descrever claramente o tema desejado, o estilo artístico, o ambiente, os requisitos técnicos e a expressão emocional. De seguida, vamos explorar como escrever sugestões de qualidade que inspirem a criatividade do GPT-4o.
Sugestões de palavras-chave para criar imagens realistas
No atual panorama das redes sociais infestado de imagens de IA, a capacidade de fazer com que as imagens geradas por IA pareçam mais realistas e naturais tornou-se uma competência importante. Curiosamente, a chave para o realismo não reside muitas vezes na procura da perfeição, mas na criação deliberada de "imperfeições".
Acrescentar "deliberadamente imperfeito" à pergunta.
As fotografias da vida real não são perfeitas. Muitas vezes, têm pequenas imperfeições, como ângulos aleatórios ou estranhos, iluminação irregular, uma ligeira desfocagem da imagem ou elementos desordenados no fundo. Ser pró-ativo na descrição destas "falhas" quando se escrevem sugestões pode aumentar o realismo da imagem.
Exemplos de avisos::
enquadramento inadequado, iluminação irregular, ligeiramente desfocada, ligeira sobre-exposição, elementos de fundo aleatórios
Adicionar cenários realistas e descrições de personagens
Em vez de escrever apenas descrições gerais como "retrato" ou "fotografia", seja específico sobre quem é a pessoa, o que está a vestir, onde se encontra, a hora do dia e as suas emoções. Isto dá à imagem um sentido de história e de cena e afasta-a dos estereótipos da composição de IA.
Exemplos de avisos::
Um chinês de 22 anos e uma estrela pop sorriem casualmente juntos no Shanghai Bund à noite, inclinando-se ligeiramente um para o outro, descontraídos e naturais.
Equipamento de câmara analógica e efeitos de filmagem
A especificação de um modelo de câmara CCD mais antigo (por exemplo, Canon A650 IS, Sony DSC-W630) no prompt cria uma sensação de granulação e idade. Especificar se o flash está ligado ou desligado, as caraterísticas tonais e a granulação permitem que a IA simule a lógica de uma fotografia de câmara real, em vez de um efeito de pintura perfeito.
Exemplos de avisos::
captada com uma câmara CCD (Canon A650 IS), flash ligado, grão intenso, tons quentes e nostálgicos
A fórmula universal para imagens realistas
Combinando as dicas acima, obtemos uma fórmula para criar imagens de aspeto realista:
[Descrição das personagens], [Vestuário e movimentos], [Localização], [Elementos de fundo e iluminação], [Equipamento de filmagem], [Grão e tom], [Descrição das imperfeições], [Ilustração do estilo de vida e estilo casual]
Exemplo de uma palavra-chave completa::
Uma fotografia espontânea, mal enquadrada, de um chinês de 22 anos a tirar acidentalmente uma selfie com Cai Xukun no Shanghai Bund, à noite. Ambos parecem descontraídos e informais. O fundo mostra as luzes da cidade, os reflexos do rio Huangpu e a Torre Pérola Oriental. Ligeiramente desfocada, iluminação irregular, sobre-exposição. Fotografada com uma câmara CCD, flash ligado, grão pesado, tons quentes e nostálgicos, estilo instantâneo casual e acidental.
Guia de palavras-chave para imagens de estilo Q e criativo
O GPT-4o não só cria imagens foto-realistas, mas também cria imagens criativas numa variedade de estilos, e é particularmente bom em personagens Q engraçadas e cenas criativas.
Conversão de caracteres do formato Q
A conversão de fotografias realistas em personagens bonitas da versão Q é um dos destaques do GPT-4o. Basta carregar as fotografias e adicionar as instruções adequadas para obter um belo efeito de versão Q.
Versão Q da cena da proposta::
Converta as duas pessoas da fotografia em personagens 3D da versão Q, a cena é transformada num pedido de casamento, o fundo é transformado num arco feito de pétalas leves e coloridas, o fundo é transformado em cores românticas e as pétalas de rosa são espalhadas pelo chão. Exceto as personagens, que têm um estilo de personagens 3D da versão Q, o restante ambiente tem um estilo realista.

Casamento chinês versão Q::
Converter as duas pessoas da fotografia em personagens 3D de versão Q, traje de casamento chinês antigo, grande cor vermelha, padrão de fundo "Xi" estilo corte de papel. Requisitos de vestuário: realista, o homem usa uma túnica comprida e um colete, o corpo principal é vermelho, com um padrão de dragão bordado a ouro, realçando a dignidade e a atmosfera, com uma grande flor vermelha no peito, que é um símbolo de celebração e boa sorte. A mulher está vestida com um vestido à mostra, também de cor vermelha, decorado com requintados padrões dourados e bordados de fénix, mostrando um sentido de elegância e magnificência, com flores na cabeça e acessórios para o cabelo, acrescentando um temperamento suave e gentil.

Transições de cena criativas
O GPT-4o é capaz de transformar fotografias comuns em cenas criativas, tornando as fotografias comuns extraordinárias.
Efeito de moldura fotográfica estereoscópica::
A personagem da cena é transformada num estilo de versão 3D Q e colocada numa fotografia Polaroid, o papel é segurado por uma mão e a personagem da fotografia sai da fotografia Polaroid, apresentando um efeito visual que rompe as fronteiras da fotografia bidimensional e entra no espaço real bidimensional.

Recriação de cenas do Titanic::
Converta a personagem da imagem anexa numa forma 3D bonita em versão Q. Cena: na proa mais alta de um navio de cruzeiro de luxo com uma proa pontiaguda. O homem está de pé na proa do Titanic com a mulher, o homem tem os braços à volta da cintura da mulher, a mulher usa um vestido com os braços esticados, virados para o vento, o seu rosto está cheio de liberdade e felicidade. Nesta altura, o céu está na cor quente do crepúsculo e o mar estende-se por baixo do navio. Com exceção das personagens, que são em versão Q e modelação 3D, todos os outros ambientes são reais.

Ícones criativos de peluche e insufláveis
O GPT-4o é capaz de converter ícones planos em pelúcias tridimensionais ou estilos insufláveis para criar efeitos visuais coloridos.
Emoji de peluche::
Transforme um simples ícone vetorial plano [emoji que pretende gerar] num objeto macio, tridimensional, peludo e bonito. A forma geral está completamente coberta por pelo espesso, que tem uma textura extremamente realista com sombras suaves. O objeto está centrado e suspenso num fundo cinzento claro e limpo, flutuando ligeiramente. O estilo geral é surrealista, tátil e moderno, proporcionando uma experiência visual acolhedora e divertida. Renderizado à escala 1:1 com iluminação de qualidade de estúdio e alta resolução.

Emoji de brinquedos insufláveis::
Crie uma representação 3D de alta resolução do [emoji a ser gerado] concebido como um objeto insuflável e inchado. A forma deve parecer macia, arredondada e cheia de ar, como um balão de pelúcia ou um brinquedo insuflável. - A forma deve parecer macia, arredondada e cheia de ar, como um balão de pelúcia ou um brinquedo insuflável. Utilize uma textura suave e mate com vincos e costuras subtis no tecido para realçar o aspeto insuflável. A forma deve ser ligeiramente irregular e mole, com sombras suaves e uma iluminação suave que realce o volume e o realismo. Coloque-o num fundo limpo e minimalista Coloque-a sobre um fundo limpo e minimalista (cinzento claro).

Modelos do Cue Word para cenários de aplicação profissional
O GPT-4o não é apenas adequado para projectos criativos pessoais, mas também pode desempenhar um papel importante em cenários profissionais. Abaixo encontram-se alguns modelos de palavras-chave para cenários de aplicação específicos.
Apresentação de produtos e comércio eletrónico
No mundo do comércio eletrónico, onde as imagens de produtos de alta qualidade são cruciais, o GPT-4o gera imagens de apresentação de uma vasta gama de produtos, desde produtos alimentares a artigos de moda, que são apresentados a um nível profissional.
Apresentação do produto::
Conceber um gráfico vibrante e elegante para uma raquete Pico chamada "The Pickled Pro". O designer precisava de mostrar claramente a vista frontal da raquete, com as suas cores arrojadas, padrões geométricos divertidos e nome da raquete incorporado, bem como a vista lateral, destacando a sua pega ergonómica e confortável, construção leve e fina, superfícies texturizadas para controlo da rotação e protectores de extremidade duradouros.

Design de embalagens::
Criar uma embalagem vibrante e cativante para um snack bar de proteínas chamado GPU Crunch. Foram utilizados ícones minimalistas e de linhas finas para realçar claramente os ingredientes deliciosamente saudáveis da embalagem - pedaços de chocolate preto, amêndoas torradas e aveia integral. Apresentar a tabela de informação nutricional ("12g de proteínas", "4g de açúcar", "20g de hidratos de carbono") num tipo de letra mais pequeno. Colocadas de forma realista sobre um fundo branco, as barras estão rodeadas de equipamento de fitness (garrafas de água, toalhas de treino, auscultadores) para demonstrar a combinação de uma vida saudável com um desempenho de alta tecnologia.

Design gráfico e marca
O GPT-4o é capaz de gerar uma variedade de trabalhos de design gráfico, incluindo cartazes, capas de revistas, páginas promocionais, etc., para satisfazer as necessidades de promoção da marca.
Cartazes promocionais vintage::
Cartaz promocional vintage, destacando texto chinês com um padrão radiante vermelho e amarelo no fundo. No centro da imagem está uma bela jovem, desenhada num delicado estilo retro, sorridente, elegante e acessível. O tema é a promoção do mais recente serviço de pintura com IA da GPT, salientando o "fantástico preço de 9,9/folha", "aplicável a todos os tipos de cenas, fusão de imagens, redesenho local", "apresentação de 3 revisões por folha", "efeito direto de IA, sem necessidade de modificação" e, na parte inferior dos cartazes, uma etiqueta apelativa: "Se tiver intenção de clicar no canto inferior direito, "Quero"", e uma ação de clicar com o dedo no canto direito, e o logótipo OpenAI no canto inferior esquerdo.

Capas de revistas de moda::
Crie uma capa de revista profissional e visualmente atractiva chamada "Urban Pulse". Inclui claramente os seguintes títulos de artigos: "10 cafés escondidos que vai adorar em Nova Iorque", "Apartamentos minimalistas: pequenos espaços, grandes ideias" e "Entrevista exclusiva: bastidores da banda indie Echo District". Utiliza tipos de letra modernos, cores vibrantes e inclui uma fotografia principal impressionante de um homem em frente a uma cena citadina.

Jogos e material de anime
Para os criadores de jogos e entusiastas de anime, o GPT-4o gera uma grande quantidade de material, desde a conceção de personagens à construção de cenários.
Cenários realistas de personagens de jogos::
Uma representação 3D ultrarrealista do design da personagem Natasha do jogo Command & Conquer: Red Alert 3 de 2008, modelado exatamente como o original. A cena passa-se num quarto escuro e desarrumado de 2008, onde a personagem está sentada no tapete em frente a uma televisão antiga a jogar Command & Conquer: Red Alert 3 e a um GamePad. O quarto está cheio de nostalgia dos anos 2008: sacos de snacks, latas de refrigerante, posters e fios emaranhados.

Cartas de atributos de personagens RPG::
Crie um cartão de personagem digital ao estilo de uma coleção de RPG. O protagonista é um [profissão ou personagem], de pé e confiante, rodeado de ferramentas ou símbolos relacionados com o seu trabalho. A representação geral é em estilo de banda desenhada 3D com iluminação suave para mostrar uma personalidade distinta. O cartão contém barras de competências ou valores de atributos, por exemplo, [Competência 1 +x], [Competência 2 +x]. Adicione uma faixa de título na parte superior do cartão e uma etiqueta com o nome na parte inferior. O contorno do cartão é desenhado com linhas simples, semelhante a uma caixa de modelo de personagem real. O fundo deve corresponder ao estilo temático da profissão, com um esquema de cores com reflexos e tons quentes que combinam com a profissão.

Estratégias de avanço da palavra-chave e dicas práticas
Com o básico em mãos, vamos mergulhar em algumas estratégias avançadas, dicas que o ajudarão a obter resultados mais precisos e satisfatórios com o GPT-4o.
Melhoria dos efeitos criativos através da combinação de imagens de referência
O GPT-4o permite aos utilizadores carregar imagens de referência, o que abre mais possibilidades criativas. Pode carregar fotografias e pedir ao GPT-4o para mudar de estilo, mantendo certos elementos, ou combinar estilos de várias imagens de referência.
Transição da cena da bola de cristal::
Transforma as figuras da imagem em anexo num cenário de bola de cristal. Cenário geral: a bola de cristal é colocada sobre a mesa junto à janela, com um fundo desfocado e cores quentes. A luz do sol brilha através da bola, lançando um pouco de luz dourada, iluminando a escuridão circundante. No interior da bola de cristal: as personagens são bonitas em versão Q de modelação 3D, cheias de amor umas pelas outras.

Autocolantes Q-Stickers de Emoji Multi-Pose::
Crie um novo conjunto de autocolantes chibi com seis poses únicas com a imagem do utilizador:
1. mãos na tesoura e piscar de olhos brincalhão. 2. olhos lacrimejantes e lábios ligeiramente trémulos, mostrando uma expressão de choro bonita;
2. olhos lacrimejantes e lábios ligeiramente contorcidos, mostrando uma expressão de choro engraçada;
3. abrir os braços e fazer um gesto de abraço caloroso;
4. dorme de lado, encostado a uma almofada em miniatura, com um sorriso doce
5. aponta com confiança para a frente, rodeado de efeitos especiais brilhantes
6. gestos de beijos voadores com emoticons de amor a flutuar.

Afinar as pistas para obter melhores resultados
Escrever prompts é um processo iterativo. Muitas vezes, a primeira tentativa pode não corresponder totalmente às suas expectativas. Ajustar e otimizar constantemente as palavras-chave é a chave para obter os resultados desejados.
Eis algumas dicas de afinação:
- O concreto é melhor do que o abstratoUtilize descrições concretas em vez de conceitos abstractos. Por exemplo, em vez de dizer "bela paisagem", diga "relva verde sob montanhas cobertas de neve, com o sol a brilhar por entre as nuvens em manchas douradas".
- Equilíbrio do nível de pormenorPistas demasiado curtas podem levar a resultados incorrectos, mas pistas demasiado longas podem ser confusas. Encontre um equilíbrio que forneça informações suficientes sem limitar indevidamente a criatividade da IA.
- ensaio de lotesSe for pretendido um estilo ou efeito específico, tente gerar várias versões, depois escolha a que melhor corresponde às expectativas e continue a iterar com base nessa versão.
- Histórias de sucesso na aprendizagemAnálise das palavras-chave bem sucedidas, compreensão da sua estrutura e elementos e aplicação destas lições às suas próprias criações.
Perguntas frequentes e estratégias de solução
Quando utiliza o GPT-4o para gerar imagens, pode deparar-se com alguns problemas comuns. Aqui estão algumas estratégias para os resolver:
- Os resultados não corresponderam às expectativasTente reorganizar as palavras-chave para realçar os elementos mais importantes ou utilizar descrições mais específicas.
- Qualidade de imagem insuficienteAdicionar instruções como "alta qualidade", "pormenor" ou "resolução 4K" ao pedido.
- incongruência de géneroEstilo: Forneça uma imagem de referência ou especifique claramente o estilo no prompt, como "no estilo do Studio Ghibli" ou "renderização fotorrealista".
- Problemas de renderização de textoSe precisar de incluir texto na imagem, mantenha-o curto e indique claramente a localização e o estilo do texto na pista.
- Cenários complexos são difíceis de gerarCenário: Divida uma cena complexa em vários elementos simples, ou comece com uma cena de base e depois acrescente mais detalhes com pistas subsequentes.
Com a prática e a experiência contínuas, poderás tornar-te mais proficiente na comunicação com o GPT-4o para criar trabalhos visuais impressionantes. Lembra-te, o mais importante é manteres-te curioso e explorador, e aproveita a diversão da criação assistida por IA!
Se quiser utilizar a conta exclusiva paga oficial GPT Plus, Claude Pro, Grok Super, pode contactar a nossa equipa de profissionais (wx: abch891) se não souber como carregar a sua conta.