A revolução silenciosa que está tornando o seu telefone mais inteligente que você na fotografia
NotíciaA inteligência artificial (IA) está chegando a quase todos os aspectos de nossas vidas. São os nossos telefones, enquanto muitos de nós deixamos entrar em nossas casas na forma de assistentes de voz em alto-falantes inteligentes.
Essas são apenas as implementações mais visíveis da IA, e nos próximos anos serão cada vez mais usadas nos bastidores, nas engrenagens que manterão nossas cidades cada vez mais inteligentes funcionando.
No entanto, é na imagem e na fotografia que você consegue ver a inteligência artificial trabalhando com mais clareza. Vejamos alguns dos melhores exemplos desta nova tecnologia que aumenta ativamente a fotografia.
Fina câmera AI
A versão mais comercializada da AI fotográfica hoje é em smartphones. Muitos modelos novos e recentes têm recursos assistidos por inteligência artificial que usam vários tipos de reconhecimento de cena e objeto para aprimorar suas fotos.
Diferentes fabricantes de telefones têm diferentes abordagens e características distintas - com alguns desvios interessantes nas abordagens.
Huawei AI
Poucas empresas gritam alto em relação à inteligência artificial em telefones como a Huawei - é um ponto de destaque se você quer comprar um aparelho como o Huawei P20 Pro..
Há um modo de disparo AI separado no aplicativo da câmera que, no Mate 20 Pro, pode reconhecer 1.500 cenas e situações diferentes. O processamento, em seguida, aplica um perfil de cor e contraste para se adequar, para tornar suas imagens realmente pop.
Um olhar ultra-natural não é o objetivo aqui. Saturação de cor máxima da fotografia Huawei AI para um maior impacto, não fidelidade máxima. Os resultados vão bem nas mídias sociais, embora.
Iluminação de retrato Apple
O Portrait Lighting é um dos recursos de fotografia assistida por IA da Apple e emula o efeito de vários tipos de iluminação de estúdio. Alguns outros telefones, como o Huawei P20 Pro, também tiveram uma falha neste conceito, mas a Apple apresentou a melhor implementação até hoje..
Então, por que é AI? O Portrait Lighting envolve a criação de um mapa de profundidade 3D do rosto do assunto e a aplicação de um filtro 3D para adicionar efeitos de iluminação que seguem os contornos de seus recursos, como se estivessem sendo iluminados por uma configuração de iluminação de estúdio.
A Apple chama isso de “estúdio no seu bolso”. Não substituirá um estúdio, é claro, mas os resultados podem ser surpreendentemente eficazes.
Google Lens
O Google é o desenvolvedor mais prolífico de tecnologias de IA, e vários dos modos de câmera em seus telefones flertam com o processamento semelhante ao AI.
O Top Shot do Pixel 3, por exemplo, é um modo burst que captura uma série de imagens e depois escolhe aquelas que acha que são as melhores. Photobooth faz o mesmo tipo de coisa, mas por fotos de você e seus amigos fazendo caretas. Ou sorrindo.
O Google Lens é uma demonstração mais dinâmica da IA, no entanto. É um modo de câmera que acessa a imagem e o reconhecimento de texto do Google, colocando-os em um contexto do mundo real. Você pode apontar seu telefone para produtos, pontos de referência e até mesmo padrões de papel de parede, e o Lens tentará encontrá-los on-line e fornecer informações relevantes.
Fotos do Google
Há um uso mais prático e quase oculto para a rede neural que entra no reconhecimento de imagens do Google - o Google Fotos e, em particular, sua função de pesquisa.
Na parte superior do aplicativo do Google Fotos, você verá agora uma barra de pesquisa. Você pode digitar objetos ou temas nele e os algoritmos AI do Google entram em ação para encontrar imagens relevantes. Experimente. 'Cães', 'Natal' e até 'queijo' retornarão fotos relevantes, se estiverem na sua fototeca.
Fotos também reproduz o curador, escolhendo imagens para se transformar em GIFs animados, para melhorar com filtros e costurar panoramas. Tudo isso é baseado em um tipo avançado de reconhecimento de imagem que é, em alguns círculos, considerado IA.
Restauração de imagem da Nvidia
Algumas implementações da IA podem parecer comuns quase instantaneamente, mas há algumas aplicações nos trabalhos que parecem genuinamente futuristas.
As técnicas de aprimoramento de imagem da Nvidia são algumas das mais impressionantes demonstrações visuais do mundo real da IA contextualizada, e existem três maneiras de implementar a tecnologia que promete grandes coisas.
O primeiro é 'desnizing' de imagens. Ele usa um método baseado em aprendizagem profunda para restaurar dados de imagem obscurecidos por ruído ou até mesmo texto. Esta é, na verdade, uma versão pura e muito avançada do que as câmeras de telefones fazem ao remover o ruído da imagem de uma foto.
No entanto, é informado por uma rede neural treinada pela exposição a massas de outras imagens, o que ajuda a reconhecer padrões e interpolar dados ausentes da imagem de origem..
Há uma demonstração mais dramática do poder da rede neural da Nvidia também, na forma de AI in-painting. Na demo, partes de uma imagem de origem são removidas e re-desenhadas, a informação que falta é interpolada através, novamente, da rede neural treinada em imagem.
Finalmente, a Nvidia pode transformar vídeo de 30fps ou 60fps em imagens de 480fps em câmera lenta, 16 vezes mais lenta que o padrão. Assim como na técnica de pintura, a inteligência artificial é usada para criar dados de imagem que simplesmente não estão lá na metragem de origem.
As TVs realmente têm modos de quadros interpolados comparáveis. No entanto, o AI da Nvidia pode lidar, por exemplo, com o fluxo de tecido muito melhor, para resultados mais naturais.
Iconem
A IA atual é em grande parte muito pequena, não muito 'inteligente', cálculos que, quando aplicados em larga escala, produzem resultados surpreendentes
Esta descrição é certamente verdadeira também para o Iconem, uma startup de patrimônio que usa IA desenvolvida pela Microsoft..
O objetivo do Iconem é registrar imagens de importantes locais históricos sob ameaça de guerra, erosão ou outros tipos de danos, criando um registro realista de seu estado atual..
O trabalho da IA aqui é mapear dezenas de milhares de fotos em um modelo 3D escaneado de um patrimônio, usando drones para capturar as imagens necessárias. Iconem visita locais de difícil acesso ou perigosos, como a Grande Mesquita de Umayyad em Aleppo, na Síria devastada pela guerra.
Você pode ver algumas das varreduras do Iconem em ação no YouTube, e suas varreduras de Aleppo foram transformadas em um aplicativo, disponível no Google Play.
Google BigGAN
Você pode conhecer o Google por seu mecanismo de pesquisa e sistema operacional móvel Android, mas também está desenvolvendo montanhas de novas tecnologias inovadoras por meio de seus programas e ramificações do Labs..
A DeepMind é a divisão AI da Alpha, empresa controladora do Google, e a BigGAN é um de seus mais recentes projetos - criados por um estagiário, não menos. Este é um software de IA que gera imagens usando algoritmos.
Primeiro, uma imagem é gerada algoritmicamente a partir de um número aleatório. A imagem é então comparada a uma imagem 'real' para analisar a proximidade dela. Uma nova versão da imagem é então criada, na tentativa de tornar suas características mais próximas daquela referência do mundo real..
Você pode conferir alguns dos resultados do BigGAN online. Pode criar texturas naturais incrivelmente realistas, como grama e linhas de árvores. No entanto, rostos humanos gerados pelo BigGAN ainda se parecem com os pesadelos de Francis Bacon.
- Trazido para você em associação com a Nokia e Android One, ajudando você a fazer mais do seu smartphone. Você pode aprender mais sobre o novo Nokia 7.1 aqui, e você encontrará mais dicas sobre como aproveitar ao máximo seu telefone Aqui.