
Rede social pretende disponibilizar o conjunto de dados em novembro
O desafio dos projetos de visão computacional é fazer com que uma máquina enxergue e compreenda o mundo como um ser humano faria. O Facebook tem algumas iniciativas neste sentido, mas o Ego4D é o projeto mais recente e com enfoque nesta premissa, criado especialmente para montar um vasto conjunto de dados de treinamento dos modelos.
A ideia do Ego4D é gerar uma IA capaz de interpretar as mais de 2.200 horas de filmagem feita por 700 participantes de 13 universidades em nove países. Segundo a cientista-chefe de pesquisa do Facebook, Kristen Grauman, esta é a maior coleção de dados explicitamente criada para este foco: cada filme foi produzido sob a perspectiva de visão do usuário para dar à máquina as mesmas condições do ser humano.
As filmagens retratam experiências comuns da vida cotidiana de pessoas, como interações sociais, manipulação de objetos com as mãos e tarefas como cozinhar e arrumar a casa. O objetivo é associar isso aos algoritmos das redes sociais, no intuito de entregar melhores experiências de visão computacional sobre a ótica do espectador.
O Facebook pretende disponibilizar o conjunto de dados em novembro para os pesquisadores interessados em atuar em parceria com a Ego4D. Se os testes iniciais derem certo, é provável que a companhia estenda o experimento ao ambiente externo, para empresas especializadas em treinar máquinas que compreendam o que os seres humanos fazem rotineiramente.
Com a chegada dos modelos de óculos Ray Ban com câmeras do Facebook, esse projeto só tende a crescer porque será preciso interpretar os dados capturados para entregar uma experiência utilitária ao usuário. É claro que esse é um terreno muito delicado, já que a privacidade das pessoas está em jogo, mas as empresas modernas precisarão estar atentas a essa tecnologia se quiserem ser relevantes no futuro.
FONTE: Canaltech | FOTO: Pixabay
