Visualização de Relatório




G2: Distribuição de tipos de tecnologias adotadas nas páginas Web (2017)



Definição do Indicador


Valor percentual dos tipos de tecnologias usados nas páginas da Web brasileira (.br).


Propósito


Obter uma distribução dos tipos de linguagens usados nas páginas da Web brasileira (.br) de acordo com uma lista de valores pré-determinados (PHP, ASP, ASPX, JSF, JSP, etc.).


Metodologia


A determinação de tecnologias usadas é um desafio porque uma página coletada não possui obrigatoriamente informações sobre a tecnologia que a gerou. Uma opção, que adotamos, foi nos basear nas eventuais extensões de arquivo presentes na URL.


Para determinar as tecnologias partimos, de uma dicionário de 406 extensões de arquivos e processamos o arquivo de páginas válidas (OK), verificando em cada URL listada naquele arquivo a ocorrência de uma extensão válida. Uma extensão válida deve ocorrer antes da primeira “?” da URL e a partir da última “/” que antecede essa “?”. O processo verifica então, por casamento de padrões, a ocorrência das extensões na cadeia delimitada por “/” e “?” da URL. Para extensões que tenham o mesmo radical (p.ex., asp e aspx) é considerada a mais longa.


O ponto de partida da metodologia foi apurar quais as possíveis extensões, como medida das tecnologias utilizadas. Nesse caso, buscamos uma lista de 397 extensões de arquivos a partir do sítio http://www.file-extensions.org . Com base nessas extensões, fizemos a análise da URL de cada página coletada de forma a identificar quais extensões ocorriam na URL.


Feita a identificação de extensões, temos 3 casos possíveis. O primeiro caso é que nenhuma extensão foi encontrada na URL, o que impede que possamos estimar qual a tecnologia utilizada. O segundo caso é que encontramos exatamente uma extensão, caso no qual a tecnologia, se for o caso, é associada diretamente. O terceiro caso é quando mais de uma extensão é associada à URL e é necessário estimar qual das extensões detectadas é a mais pertinente. Utilizamos dois critérios para detectar a extensão mais pertinente. O primeiro critério é a posição onde a extensão ocorre na URL, com base na premissa que a extensão do primeiro arquivo que ocorre identifica a sua tecnologia base. Esse critério foi validado em uma porção significativa dos casos. O segundo critério é, para extensões que ocorram na mesma posição, escolha a maior, por ser naturalmente mais discriminativa. Por exemplo, considere que as extensões php e php3 são detectadas a partir da mesma posição em uma URL, o que explica pelo fato de php ser parte de php3. Neste caso, a extensão selecionada será php3, pois ela é maior e mais discriminativa.


O último passo da metodologia é selecionar, dentre as extensões identificadas, aquelas associadas a tecnologias. Esse processo é feito manualmente, verificando as extensões que efetivamente ocorrem e as suas respectivas descrições.


Apresentação do Resultados


Um resumo descritivo dos dados sobre distribuição dos tipos de objetos na Web governamental está apresentado em duas tabelas (G2-1 e G2-2). A Tabela G2-1 apresenta as tecnologias adotadas nas páginas Web.


Tabela G2-1A: Tecnologias adotadas - Linguagens de Programação



Tecnologia Quantidade % Descrição


Tabela G2-1B: Tecnologias adotadas - demais tipos de extensão



Tecnologia Quantidade % Descrição


A Tabela G2-2 apresenta como está a adoção de tais tecnologias adotadas nas unidades federativas, em sítios gov.br que não estão associados diretamente a uma dessas unidades federativas e outros sítios, obtidos em razão de acesso via redirecionamento de um site governamental.


Tabela G2-2A: Tecnologias adotadas (recorte por unidade federativa) - Linguagens de Programação



Estado asp aspx cgi jsp php py


Tabela G2-2: Tecnologias adotadas (recorte por unidade federativa) - demais tipos de extensão



Estado INDEFINIDO cfm com dll do exe jsp nsf sql wsp


Análise


Considerando apenas as extensões relacionadas a linguagens de programação, observa-se predominância do uso da tecnologia PHP, que está presente em 79,3% das páginas Web. Em seguida estão as tecnologias ASP (14,3%) e ASPX (2,5%). O uso da linguagem Java (através das tecnologias JSP, JSF etc.) ainda é restrito nos sítios Web governamentais. Porém existe algo importante a considerar que é a tendência na atualidade de não informar a extensão no documento.


Análise Comparativa com estudo anterior e considerações


Ao comparar estes resultados com a pesquisa anterior do Censo da Web Governamental Brasileira (2012), observa-se que o uso da tecnologia PHP manteve-se estável, na casa dos 79%. O uso de ASP reduziu levemente, de caiu de 15,2% para 14,3%, sendo que a tecnologia ASPX apresentou pequena variação, passando de 2,8% para 2,5%. Com base nos resultados apresentados, podemos estabelecer algumas conclusões importantes em termos de tendências observadas na comparação das pesquisas: (i) não se pode afirmar com certeza sobre a adoção real de certas tecnologias nas páginas Web, visto que existe uma tendência mais recente de omitir o formato do objeto nas páginas Web, dificultando a identificação da tecnologia adotada, o que precisa ser melhor avaliado. (ii) o uso de tecnologias software livre no meio governamental tem crescido, como observado em relação à adoção do PHP;