Colunas

“Turbante lindo” vs. “Turbante feio”: Entenda como funciona o mecanismo do Google Images

02 de março de 2017
Postado por Gabi Torrezani

Tirar dúvidas no buscador da Google já virou rotina. Ele pode nos salvar em diversas situações – para outras, existe o SOS Solteiros. Mas será que os resultados são sempre os mais corretos?

Há pouco tempo uma enorme polêmica parou a internet, tudo por conta do uso de turbantes; um debate sobre apropriação cultural. Mulheres, homens, ativistas de todas as raças entraram em confronto virtual para defender seu posicionamento sobre o uso da peça.

Sem fazer juízo de valor, uma das publicações nesse emaranhado de opiniões nos chamou muita a atenção, pois envolveu o Google Images e uma pesquisa curiosa:

“Turbante lindo” vs. “Turbante feio”

reprodução - Google Images

Pesquisa feita com as palavras “turbante lindo” e depois com as palavras “turbante feio”.

Os resultados nos espantaram. Na busca de imagens por “turbante lindo” o buscador trouxe maior quantidade de imagens de mulheres brancas usando turbante. Já na busca de imagens por “turbante feio”, a busca trouxe uma maioria de mulheres negras com turbante.

O mais curioso (e bizarro) disso tudo é que, ao entrar nas imagens do “turbante feio”, por exemplo, os termos “turbante” e “feio” não estavam combinados nos textos, nem em comentários ou links. Um grande oceano de dúvidas ecoou na redação.

Afinal, como funciona a indexação de imagens nas buscas do Google?

Depois de ver a discrepância, começamos a pesquisar como funciona essa indexação de imagens nas buscas do Google (a ordem e quais conteúdos o buscador escolhe mostrar). Segundo o site especializado SEO Marketing, o buscador descobre páginas na internet seguindo links através do Googlebot, seu robô.

Sabendo disso, é preciso entender quais critérios esse robô usa para escolher imagens a fim de listar nos resultados de determinada busca. Se uma imagem não tem texto, como saber exatamente que o conteúdo da foto se refere às palavras-chaves buscadas?

Segundo Rodrigo Blankenburg, especialista em SEO, os buscadores possuem uma infinidade de atributos para indexar e justificar a posição em que tal site ou imagem estará dentro dos resultados orgânicos.

“Dentro dos inúmeros atributos, lógicas e análises que o Google criou – e não divulga por nada – como fundamento para justificar o posicionamento dos resultados, estão as imagens.”

Rodrigo afirma que o Google tem apontamentos textuais para cada imagem e eles estão na programação, ou seja, no código daquela página. Esses apontamentos de texto demonstram para o mecanismo de busca o que ele encontrará ali.

Calma. Parece tudo muito complicado, mas a ideia é simples.

O buscador utiliza o texto existente em diversos atributos da imagem (legenda e outros textos que são invisíveis ao público, mas presentes no código) e também palavras que existem na página onde aquela imagem está.

Caça-Palavras

Isso significa que, para colocar a imagem de uma mulher negra usando turbante na busca “turbante feio”, teoricamente deveria existir no código dessa imagem (ou na página na qual ela está hospedada) os termos “turbante” e “feio”. A mesma coisa para a busca de “turbante lindo” ou qualquer outra busca que você fizer.

Blog Dama Criola, https://damacriola.wordpress.com/author/damacriola/

Essa imagem aparecem em ambas as buscas, tanto por “turbante lindo” quanto por “turbante feio”.

Assim sendo, começamos a entrar nas páginas de algumas das imagens relacionadas a “turbante feio”. Em algumas dessas páginas realmente existe a palavra “feio”, seja no texto ou em comentários.

Mas, como disse anteriormente, outra boa parte das imagens que aparecem na busca por “turbante feio” não tem nenhuma citação da palavra “feio”. Não há tal palavra nos textos, tags, comentários ou atributos da imagem.

Descobrindo atributos da imagem

Para descobrir os atributos internos do código de uma imagem, segundo Rodrigo, basta clicar nela com o botão direito e selecionar “inspecionar” (isso pode ser feito no Google Chrome, tá?). Ali você verá o código da imagem com detalhes, como a legenda e outros textos que são importantes para o mecanismo de buscas, mas invisíveis para os leitores.

Fizemos o teste e abrimos o código dessas imagens de mulheres negras usando turbante, resultado da busca por “turbante feio”, as quais não tinham a palavra “feio” no texto. O objetivo era checar que, realmente, não havia a palavra “feio” escondida em algum lugar do código.

Resultado: Não há a palavra “feio” em nenhum lugar do código das imagens ou das páginas em questão.

Patricia Rammos, http://patriciarammos.com/tag/turbante/

SEM LEGENDA

Duas Prettas, http://duasprettas.blogspot.com.es/2015/12/turbantes.html

SEM LEGENDA

All Things Hair, https://www.allthingshair.com/pt-br/penteados-cortes/cabelos-crespos/prender-os-crespos-com-turbante/

SEM LEGENDA

Você deve estar pensando, “ué…“. Pois é, nós também pensamos.

Segundo Rodrigo, além da tecnologia de buscas por palavras-chave, Google também possui a inteligência de “escanear” a imagem e ler o que ela traz.

“Hoje já é possível a leitura da própria imagem, pixel por pixel, como o Facebook identifica os rostos de seus amigos e até indica quem é aquela pessoa para você. O Google consegue há muito tempo fazer isto e por essa função, não entrega imagens que não tenham sentido com a busca.”

Como o Google escolhe o que é lindo e o que é feio?

Mesmo que o Google seja inteligente o suficiente para ver que naquela foto há uma pessoa de turbante, como ele classifica algo “feio” ou “lindo”, especialmente se essas palavras-chave não estão presentes no código? Como esse julgamento de valores é feito?

A imagem a seguir, por exemplo, não tem a palavra “feio” em nenhum lugar do código. Por outro lado, no texto da página em que está anexada, a palavra “lindo” aparece. Mesmo assim, a imagem está nos resultados da busca por “turbante feio” e não por “turbante lindo”.

Um Abadá Pra Cada Dia, http://patriciarammos.com/tag/turbante/

SEM LEGENDA

Isso só acontece no Google?

Para deixar tudo ainda mais intrigante, as mesmas buscas feitas em outros buscadores trazem resultados diferentes. A proporção de mulheres negras e brancas continua misturada nos resultados, mas só o fato das buscas divergirem já é interessante.

Veja a seguir as buscas por “turbante lindo” e “turbante feio” no Yahoo:

Reprodução | Yahoo, https://br.yahoo.com/

Busca por “turbante lindo” no Yahoo

Reprodução | Yahoo, https://br.yahoo.com/

Busca por “turbante feio” no Yahoo

Também fizemos um teste usando o DuckDuckGo (um buscador alternativo que não rastreia os usuários):

Reprodução | DuckDuckGo, https://duckduckgo.com/

Busca por “turbante lindo” no DuckDuckGo

Reprodução | DuckDuckGo, https://duckduckgo.com/

Busca por “turbante feio” no DuckDuckGo

A resposta da Google

Entramos em contato com a Google Brasil para saber mais sobre o mecanismo de busca por imagens e entender porque a indexação ocorreria dessa maneira. Eles nos responderam que não possuem nenhum porta-voz que possa dar esclarecimentos técnicos sobre o tema. Legal.

Porém, a Google disponibiliza online uma explicação oficial e básica sobre o funcionamento do rastreamento e indexação. Uma das passagens desse texto indica que:

“Quando você procura por “cães”, você não quer ver uma página com a palavra “cães” escrita centenas de vezes. Você provavelmente quer imagens, vídeos ou uma lista de raças. Os sistemas de indexação do Google levam em consideração vários aspectos diferentes das páginas, como sua data de publicação, seu conteúdo em termos de fotos e vídeos, e muito mais.”

No canal do Youtube Google Webmasters, há um vídeo no qual Peter Linsley, gerente de produtos na Google e especialista em Image Search, explica o mecanismo de busca por imagens detalhadamente.

Em uma das passagens do vídeo, Linsley comenta:

(…) outra coisa que (os usuários) fazem é pesquisar várias imagens, com muitas páginas de resultados. Eles buscam as imagens que querem a fundo. Uma das razões para isso acontecer é o fato de que muitas pesquisas são subjetivas. Por exemplo, se você pesquisar por “cachoeira”, a cachoeira que você gosta e a que eu gosto podem estar em páginas diferentes. É impossível que o mecanismo de busca saiba exatamente o que você procura.

Assista ao vídeo completo (em inglês):

Vale lembrar que…

Em 2015, a Google já teve um grave problema com a indexação de imagens. O algoritmo do buscador indexou duas pessoas negras na categoria de “gorilas”.

A resposta oficial da empresa, seguida de um pedido de desculpas, indicava que o sistema de algoritmos pode falhar, especialmente porque não considera o contexto geral das imagens, bem como a importância simbólica de certos conceitos nas diversas culturas humanas.

Pois é.

Todas as buscas mencionadas foram feitas entre 19 e 23 de fevereiro de 2016.

Google - Por dentro da pesquisa, Canal do Youtube Google Webmasters, SEO Marketing, Carta Capital, Business Insider

MATÉRIAS RELACIONADAS