A Microsoft conseguiu um avanço considerável em sua tecnologia de inteligência artificial (IA) para reconhecimento de imagens. A ferramenta é usada, principalmente, para descrever imagens e fotografias para pessoas com visão limitada ou até sem visão, e foi incorporada numa atualização do app Seeing AI da empresa, mas deve aparecer também em alguns de seus outros programas mais populares no futuro, como o Word, o Outlook e o PowerPoint.
O Seeing AI foi lançado originalmente em 2017 e usa inteligência artificial para reconhecer e descrever as imagens que estão aparecendo na tela do smartphone para quem tem dificuldades em enxergar. Ele identifica objetos, animais, lugares, etc, além de ler textos em voz alta. Agora, com o avanço divulgado pela Microsoft, a tecnologia se sai muito melhor nessa função e chegou até a superar humanos em alguns casos específicos.
Vídeo de divulgação da nova IA da Microsoft, mostra imagens sendo descritas com mais detalhes agora do que antes.
Explicando melhor a declaração de "superar humanos", foram feitos testes num programa especial que avalia justamente a capacidade de uma IA de descrever imagens, e comparação a humanos. Nesse teste, que se chama "nocaps", em alguns casos a nova IA da Microsoft descreveu as imagens melhor do que algumas das descrições feitas por humanos disponíveis no nocaps.
No entanto, isso é um caso muito isolado e a IA da empresa está longe de simplesmente substituir humanos na tarefa de reconhecer imagens.
"Como acontece em muitos testes, o teste do nocaps é apenas um indicador bem geral da performance dos modelos na tarefa. Superar a performance dos humanos no nocaps de maneira alguma indica que os sistemas IA superam humanos na compreensão de imagens."
Citação de Harsh Agrawal, um dos criadores do nocaps
"Como acontece em muitos testes, o teste do nocaps é apenas um indicador bem geral da performance dos modelos na tarefa. Superar a performance dos humanos no nocaps de maneira alguma indica que os sistemas IA superam humanos na compreensão de imagens."
Citação de Harsh Agrawal, um dos criadores do nocaps
Isso acontece porque muitos casos exigem um certo nível de abstração para interpretar uma imagem e realmente explicar para uma pessoa o que está aparecendo ali, algo que as IAs ainda têm grande dificuldade em fazer.
Via: The Verge Fonte: Microsoft