Você sabia que temos um conferência online sobre o design do produto chegando? ARRANCADA abordará como designers e proprietários de produtos podem ficar à frente da curva nesses tempos sem precedentes.

Ao longo dos últimos anos, artigos e postagens no blog começaram a fazer uma versão da mesma pergunta: “Por que todos os sites estão começando a ter a mesma aparência?

Essas postagens geralmente apontam alguns elementos de design comuns, desde imagens grandes com texto sobreposto até menus de hambúrguer, que são essas três linhas horizontais que, quando clicadas, revelam uma lista de opções de página para você escolher.

Meus colegas Bardia Doosti, David Crandall, Norman Su e eu estávamos estudando o história da web quando começamos a perceber essas postagens surgindo. Nenhum dos autores havia feito nenhum tipo de estudo empírico. Foi mais um palpite que eles tiveram.

Decidimos investigar a reivindicação para verificar se havia alguma verdade na noção de que os sites estão começando a ter a mesma aparência e, se houver, explorar por que isso está acontecendo. Então nós corremos uma série de estudos de mineração de dados que examinou quase 200.000 imagens em 10.000 sites.

Como você mede a similaridade?

É praticamente impossível estudar a internet inteira; existem mais de um bilhão de sites, com muitas vezes mais páginas da web. Como não há uma lista de todos para escolher, executar uma amostra aleatória da Internet está fora de questão. Mesmo que fosse possível, a maioria das pessoas vê apenas uma pequena fração desses sites regularmente, portanto uma amostra aleatória pode nem mesmo capturar a Internet que a maioria das pessoas experimenta.

Acabamos usando os sites de o Russell 1000, as principais empresas dos EUA por capitalização de mercado, que esperávamos que fossem representativas das tendências do design corporativo da Web convencional. Também estudamos outros dois conjuntos de sites, um com os 500 sites mais trafegados do Alexa e outro com sites indicados para Webby Awards.

Como estávamos interessados ​​nos elementos visuais desses sites, como dados, usamos imagens de suas páginas da Web de o arquivo da Internet, que preserva regularmente sites. E como queríamos reunir dados quantitativos comparando milhões de pares de sites, precisamos automatizar o processo de análise.

Para fazer isso, tivemos que escolher uma definição de “similaridade” que pudéssemos medir automaticamente. Investigamos atributos específicos, como cor e layout, bem como atributos aprendidos automaticamente a partir de dados usando inteligência artificial.

Para os atributos de cor e layout, medimos quantas edições pixel por pixel precisaríamos fazer para transformar o esquema de cores ou a estrutura da página de um site em outro. Para os atributos gerados pela IA, treinamos um modelo de aprendizado de máquina para classificar imagens com base no site de origem e medir os atributos que o modelo aprendeu. Nosso trabalho anterior indica que isso faz um trabalho razoavelmente bom em medir a similaridade estilística, mas é muito difícil para os seres humanos entenderem em que atributos o modelo se concentrou.

Como a internet mudou?

Descobrimos que nas três métricas – cor, layout e atributos gerados pela IA – as diferenças médias entre os sites atingiram o pico entre 2008 e 2010 e diminuíram entre 2010 e 2016. As diferenças de layout diminuíram mais, diminuindo mais de 30% nesse período.