DeepSeek lança IA que supera o DALL-E 3 em geração de imagens

O Janus-Pro é um novo modelo de inteligência artificial (IA) multimodal, desenvolvido pela DeepSeek, capaz de analisar e criar imagens O post DeepSeek lança IA que supera o DALL-E 3 em geração de imagens apareceu primeiro em Olhar Digital.

Jan 27, 2025 - 22:14
 0
DeepSeek lança IA que supera o DALL-E 3 em geração de imagens

A DeepSeek, empresa de IA que recentemente ganhou destaque com seu chatbot, surpreendeu o mundo da tecnologia novamente com o lançamento do Janus-Pro, uma nova família de modelos de IA multimodais capazes de analisar e gerar imagens.

Segundo a empresa, a novidade pode superar o DALL-E 3 da OpenAI em alguns testes.

O que é e como funciona o Janus-Pro da DeepSeek?

O Janus-Pro é um novo modelo de inteligência artificial (IA) multimodal, desenvolvido pela DeepSeek, capaz de analisar e criar imagens. Ele se destaca por sua arquitetura inovadora, chamada de “estrutura autorregressiva”, e por sua capacidade de superar modelos de IA renomados, como o DALL-E 3 da OpenAI, em benchmarks de avaliação.

O Janus-Pro funciona assim: ele aprende a interpretar e gerar imagens a partir de um conjunto massivo de dados. Sua “estrutura autorregressiva” permite processar informações sequencialmente, construindo a imagem passo a passo, como se estivesse “pintando” cada pixel em sequência.

Isso o torna mais eficiente na geração de imagens complexas e mais detalhadas, por exemplo.

Arquitetura inovadora o torna uma ferramenta poderosa para desenvolvedores, artistas e pesquisadores, abrindo novas possibilidades para a criação e análise de conteúdo visual.. (Imagem: DeepSeek)

Principais características

  • Multimodal: consegue processar diferentes tipos de dados, como imagens e texto, de forma integrada. Isso permite que ele compreenda o contexto e gere resultados mais relevantes.
  • Eficiente: apresenta alto desempenho mesmo com um número menor de parâmetros em comparação com outros modelos, tornando-o mais leve e rápido.
  • Flexível: pode ser usado para diversas tarefas, desde a geração de imagens a partir de descrições textuais até a análise e edição de imagens existentes.
  • Código aberto: está disponível para download na plataforma Hugging Face sob a licença MIT, permitindo que desenvolvedores e pesquisadores o utilizem e modifiquem livremente.

O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros. Essa variedade permite que os usuários escolham o modelo mais adequado às suas necessidades, dependendo da complexidade da tarefa. Essa característica, coloca o Janus-Pro-7B, o maior da família, à frente de concorrentes como DALL-E 3, PixArt-alpha, Emu3-Gen e Stable Diffusion XL em testes como o GenEval e o DPG-Bench.

Celular com logomarca do DeepSeek colocado na frente de computador com página inicial da plataforma de inteligência artificial aberta num navegador
O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros.(Imagem: Mojahid Mottakin/Shutterstock)

As aplicações são vastas e abrangem diversas áreas, como:

  • Criação de conteúdo visual: geração de imagens originais para diferentes fins, como publicidade, design, jogos e arte digital.
  • Edição de imagens: aprimoramento e manipulação de imagens existentes, como restauração de fotos antigas, remoção de objetos e aplicação de filtros.
  • Análise de imagens: extração de informações relevantes de imagens, como reconhecimento de objetos, detecção de emoções e classificação de conteúdo.

Leia mais:

Vale lembrar que a DeepSeek, um laboratório chinês de IA financiado pela High-Flyer Capital Management, chamou a atenção do público recentemente quando seu aplicativo de chatbot alcançou o topo da App Store.

O lançamento do Janus-Pro reforça a posição da DeepSeek como um player importante no cenário da IA, impulsionando a inovação e desafiando os líderes já estabelecidos. A acessibilidade dos modelos e sua performance promissora abrem um leque de possibilidades para desenvolvedores e pesquisadores.

O post DeepSeek lança IA que supera o DALL-E 3 em geração de imagens apareceu primeiro em Olhar Digital.

Qual é a sua reação?

like

dislike

love

funny

angry

sad

wow

Equipe GuiaBom GuiaBom: Notícias Online em Tempo Real do Brasil e do Mundo!