banner
Lar / blog / IA generativa: como funciona, história e prós e contras
blog

IA generativa: como funciona, história e prós e contras

Jun 15, 2023Jun 15, 2023

Em questão de segundos, essa tecnologia de inteligência artificial pode produzir novos conteúdos em resposta a um prompt

IA generativa é um tipo de inteligência artificial que pode produzir conteúdo como áudio, texto, código, vídeo, imagens e outros dados. Enquanto os algoritmos tradicionais de IA podem ser usados ​​para identificar padrões dentro de um conjunto de dados de treinamento e fazer previsões, a IA generativa usa algoritmos de aprendizado de máquina para criar resultados com base em um conjunto de dados de treinamento.

A IA generativa pode produzir saídas no mesmo meio em que é solicitado (por exemplo, texto para texto) ou em um meio diferente do prompt fornecido (por exemplo, texto para imagem ou imagem para vídeo). Exemplos populares de IA generativa incluem ChatGPT, Bard, DALL-E, Midjourney e DeepMind.

A IA generativa é um tipo de aprendizado de máquina que, em sua essência, funciona treinando modelos de software para fazer previsões com base em dados sem a necessidade de programação explícita.

Especificamente, os modelos generativos de IA são alimentados com grandes quantidades de conteúdo existente para treinar os modelos a produzir novos conteúdos. Eles aprendem a identificar padrões subjacentes no conjunto de dados com base em uma distribuição de probabilidade e, quando solicitados, criam padrões semelhantes (ou saídas com base nesses padrões).

Parte da categoria abrangente de aprendizado de máquina chamada aprendizado profundo, a IA generativa usa uma rede neural que permite lidar com padrões mais complexos do que o aprendizado de máquina tradicional. Inspiradas no cérebro humano, as redes neurais não requerem necessariamente supervisão ou intervenção humana para distinguir diferenças ou padrões nos dados de treinamento.

A IA generativa pode ser executada em uma variedade de modelos, que usam diferentes mecanismos para treinar a IA e criar saídas. Isso inclui redes adversárias generativas (GANs), transformadores e AutoEncoders Variacionais (VAEs).

Os aplicativos de IA amplamente difundidos já mudaram a maneira como os usuários interagem com o mundo; por exemplo, a IA ativada por voz agora vem pré-instalada em muitos telefones, alto-falantes e outras tecnologias do dia a dia.

Da mesma forma, os usuários podem interagir com IA generativa por meio de diferentes interfaces de software. Essa foi uma das principais inovações na abertura do acesso e no direcionamento do uso da IA ​​generativa para um público mais amplo. Enquanto as primeiras versões de IA generativa exigiam conhecimento técnico ou de ciência de dados para interagir com o software, os desenvolvedores de IA agora estão projetando experiências de usuário nas quais prompts podem ser fornecidos e as interações podem ocorrer em linguagem simples.

Aqui estão alguns dos exemplos recentes mais populares de interfaces de IA generativas.

Criado pela OpenAI, o ChatGPT é um exemplo de IA generativa de texto para texto: essencialmente, um chatbot alimentado por IA treinado para interagir com os usuários por meio de diálogo em linguagem natural. Os usuários podem fazer perguntas ao ChatGPT, conversar de um lado para o outro e solicitar que ele componha textos em diferentes estilos ou gêneros, como poemas, ensaios, histórias ou receitas, entre outros.

Lançado em novembro de 2022, uma versão gratuita do ChatGPT está disponível para uso online. A OpenAI também vende a interface de programação de aplicativos (API) para ChatGPT, entre outras assinaturas corporativas e opções de incorporação.

DALL-E é um exemplo de IA generativa de texto para imagem que foi lançada em janeiro de 2021 pela OpenAI. Ele usa uma rede neural que foi treinada em imagens acompanhadas de descrições de texto. Os usuários podem inserir um texto descritivo e o DALL-E gerará imagens fotorrealistas com base no prompt. Ele também pode criar variações na imagem gerada em diferentes estilos e de diferentes perspectivas.

O DALL-E também pode editar imagens, seja fazendo alterações em uma imagem (conhecido no software como Inpainting) ou estendendo uma imagem além de suas proporções ou limites originais (referido como Outpainting).

Bard é uma interface de IA geradora de texto para texto baseada no grande modelo de linguagem LaMDA (Modelo de linguagem para aplicativos de diálogo) do Google. Como o ChatGPT, o Bard é um chatbot desenvolvido com tecnologia de IA que pode responder a perguntas ou gerar texto com base em solicitações fornecidas pelo usuário. O Google o classifica como uma "experiência complementar à Pesquisa do Google".