Arte com a ajuda da Inteligência Artificial Dall-e

Minha curta veia artística

Em meados de 2014, durante meu curso técnico, tive o primeiro contato com ferramentas de design, Adobe Photoshop, Dreamweaver e afins. Até que fiz algumas imagens legais e, se eu não tivesse seguido na programação, acredito que daria um foco maior para design gráfico e ilustração.

Em 2021, resolvi aprender a desenhar, segui o livro You Can Draw in 30 Days: The Fun, Easy Way to Learn to Draw in One Month or Less (link sem afiliado) e realmente aprendi bastante do básico, vi que na verdade não é tão difícil quanto pensamos e que, com um pouco de prática e técnica, já dá pra ter resultados bem legais.

Mas, além disso, nunca fui muito além nas ilustrações gráficas e design, claro que eu trabalho como FullStack, então tenho que saber o mínimo do que é aceitável ou não em um site, por exemplo. Porém é isso, nada digno de uma moldura.

As ferramentas de AI generativa

Por um tempo, estou usando o GitHub Copilot, então já estou familiarizado com Inteligencia Artificial(AI) generativas, mesmo que superficialmente.

Recentemente, eu fiquei sabendo do Dall-e (mistura de Salvador Dali com o personagem Wall-e), uma ferramenta que utiliza Deep learning para gerar imagens que correspondem a um texto inicial. Depois de pesquisar um pouco mais e ver alguns resultados, estava ansioso para testar e apliquei pra participar do early preview.

Após um mês na fila, finalmente recebi meu acesso pra testar. Ganhei 15 tokens, e esses tokens são gastos a cada geração feita.

Gerando imagens com prompts

Para gerar, basta acessar aqui, e na caixa de texto inserir o prompt.

A cada prompt, é gasto 1 token e são geradas 4 imagens. Após isso, podemos tentar gerar variações de uma das imagens ou inserir outro texto.

Os primeiros prompts que fiz foram uma tristeza. Mas eu estava aprendendo. Tentei fazer imagens mirabolantes como:

"A water bottle fused with a zeppelin chasing an F1 car"

"A cat driving an F1 car in a cyberpunk track chased by a dog driving a monocycle with a monocle"

A verdade é que eu nem sabia o que esperar e ainda estou tentando entender o que aconteceu nessa imagem do gato.

Aprimorando os prompts

Bom, percebi que o problema deveria estar nos prompts; já que é uma AI generativa, se eu melhorar e ser um pouco mais descritivo, devo ter resultados melhores.

Foi aí que tive a ideia de gerar uma capa para minha playlist do Spotify.

“A human with headphones programming the future in a retro wave style”

Já ficou bem melhor.

Vale ressaltar que o Dall-e é bem ruim para gerar imagens que contêm texto, então nem vale a pena tentar. Aqui um exemplo de logos que tentei:

“minimalist logo, hexagonal, space, coding, purple”

“minimalist logo, shapes, space, planets, coding, purple”

Nem havia pedido texto no logo, mas dá pra perceber que não é bom nisso. Mas para ter ideia, é bacana.

Um futuro interessante

A tendência é que as imagens fiquem cada vez melhores conforme a tecnologia avança, e eu estou impressionado com o que já é possível gerar hoje em dia.

Tem debates surgindo se isso é arte, se não é, como foi treinado para aprender o que é o quê, e afins, mas sinceramente acredito que são ferramentas. Um designer poderia tranquilamente gerar imagens como assets ou para evitar aquele famoso "bloqueio criativo" e com isso, ter alguma ideia.

Como dev, já uso o GitHub Copilot para me ajudar em partes mais maçantes do dia a dia.

Imagina uma AI que gera vídeos, bem provável já ter alguma empresa por aí fazendo isso.