\n\t\t\tForbes Agro\t\t<\/div>\n
As Vendas Globais de Vinhos Est\u00e3o em Queda. Mas Elas Podem Ser Revertidas?<\/h3>\n<\/li>\n<\/ul>\n<\/div>\n<\/aside>\n
Essa limita\u00e7\u00e3o n\u00e3o era apenas uma peculiaridade \u2014 ela refletia uma restri\u00e7\u00e3o fundamental em como os sistemas de IA conceituam propriedades f\u00edsicas. Modelos anteriores n\u00e3o conseguiam abstrair conceitos como volume de l\u00edquido al\u00e9m do que existia em seus dados de treinamento. Como as ta\u00e7as de vinho em fotografias geralmente aparecem parcialmente cheias, a IA n\u00e3o conseguia imaginar uma ta\u00e7a completamente cheia.<\/p>\n
Enquanto os humanos conseguem facilmente abstrair conceitos como \u201cplenitude\u201d sem experi\u00eancia direta, os sistemas de IA tradicionalmente n\u00e3o conseguiam dar esse salto. O fato de que o GPT-4o agora pode gerar uma ta\u00e7a de vinho cheia representa um avan\u00e7o significativo na capacidade da IA de lidar com conceitos abstratos e propriedades f\u00edsicas \u2014 indo al\u00e9m do mero reconhecimento de padr\u00f5es rumo a uma compreens\u00e3o mais sutil do mundo f\u00edsico.<\/p>\n
O avan\u00e7o do ChatGPT<\/p>\n
A atualiza\u00e7\u00e3o da OpenAI para o GPT-4o reformulou fundamentalmente a maneira como a IA gera conte\u00fado visual. \u201cH\u00e1 muito acreditamos que a gera\u00e7\u00e3o de imagens deveria ser uma capacidade principal de nossos modelos de linguagem\u201d, observou a OpenAI em seu an\u00fancio. \u201c\u00c9 por isso que incorporamos nosso gerador de imagens mais avan\u00e7ado at\u00e9 agora no GPT-4o.\u201d<\/p>\n
Diferentemente das vers\u00f5es anteriores, o GPT-4o integra gera\u00e7\u00e3o de texto e imagem de forma fluida. Como explicou o pesquisador da OpenAI, Gabriel Goh, \u201cesta \u00e9 uma tecnologia completamente nova por tr\u00e1s dos bastidores. N\u00e3o separamos a gera\u00e7\u00e3o de imagem da gera\u00e7\u00e3o de texto. Queremos que tudo seja feito junto.\u201d<\/p>\n
O sistema foi treinado com base na distribui\u00e7\u00e3o conjunta de imagens e textos da internet, desenvolvendo uma compreens\u00e3o mais sofisticada de como as imagens se relacionam entre si e com a linguagem. Esse treinamento, combinado com o que a OpenAI descreve como \u201cp\u00f3s-treinamento agressivo\u201d, produziu um modelo com uma flu\u00eancia visual not\u00e1vel. O sistema agora pode gerar imagens que s\u00e3o consistentes, conscientes do contexto e capazes de representar cenas complexas com precis\u00e3o sem precedentes.<\/p>\n
As novas capacidades v\u00e3o muito al\u00e9m das ta\u00e7as de vinho, tamb\u00e9m. O GPT-4o resolve v\u00e1rias limita\u00e7\u00f5es que, at\u00e9 agora, afetavam os geradores de imagem por IA. Ele pode lidar com prompts complexos com 10 a 20 objetos diferentes, em compara\u00e7\u00e3o com o limite anterior de 5 a 8. Tamb\u00e9m reproduz texto com precis\u00e3o dentro das imagens (outro ponto fraco anterior da gera\u00e7\u00e3o de imagens por IA) e mant\u00e9m consist\u00eancia visual ao longo de m\u00faltiplas itera\u00e7\u00f5es.<\/p>\n
Essas melhorias podem transformar a gera\u00e7\u00e3o de imagens por IA de uma aplica\u00e7\u00e3o majoritariamente art\u00edstica para uma ferramenta pr\u00e1tica de comunica\u00e7\u00e3o visual. \u201cDe logotipos a diagramas, as imagens podem transmitir significados precisos quando s\u00e3o ampliadas com s\u00edmbolos que se referem \u00e0 linguagem e \u00e0 experi\u00eancia compartilhadas\u201d, observou a OpenAI em seu an\u00fancio.<\/p>\n
As implica\u00e7\u00f5es pr\u00e1ticas s\u00e3o substanciais. Embora gerar uma ta\u00e7a de vinho cheia possa parecer trivial, isso representa um marco importante no desenvolvimento da IA. Isso sugere que os sistemas est\u00e3o come\u00e7ando a desenvolver uma compreens\u00e3o mais abstrata de conceitos f\u00edsicos \u2014 indo al\u00e9m da correspond\u00eancia de padr\u00f5es rumo a algo que se assemelha mais ao pensamento conceitual humano.<\/p>\n
Quanto \u00e0 disponibilidade do novo gerador de imagens por IA no ChatGPT, a OpenAI oferece essas capacidades para usu\u00e1rios dos planos Plus, Pro, Team e Gratuito como gerador de imagem padr\u00e3o no ChatGPT, com acesso para os planos Enterprise e Edu em breve. Os desenvolvedores tamb\u00e9m ter\u00e3o acesso \u00e0 API nas pr\u00f3ximas semanas. O sistema tamb\u00e9m incorpora recursos de seguran\u00e7a, incluindo metadados C2PA que identificam imagens como criadas por IA e uma ferramenta interna de busca para verificar se o conte\u00fado se originou de seu modelo.<\/p>\n
*Esat Dedezade<\/strong> \u00e9 jornalista colaborador da Forbes EUA. Escreve sobre tecnologia e estilo de vida. J\u00e1 atuou na Wired, GQ, Stuff, T3, Metro, TechRadar, What Hi-Fi?, Trusted Reviews, Expert Reviews entre outros ve\u00edculos.<\/em><\/p>\n