Valor percentual de páginas HTML da Web Governamental Brasileira (gov.br) que atendem aos padrões W3C.
Avaliar a qualidade das páginas HTML da Web Governamental Brasileira (.br) segundo sua conformidade com os padrões HTML e suas variantes especificadas pelo W3C.
Foi executado um validador W3C de documentos, que identifica o tipo de documento e informa o número de erros obtidos de acordo com esse tipo.
Para a análise desse indicador foi utilizada uma instância local do validador de páginas disponibilizado como software livre pelo W3C. Esse validador consegue validar a maior parte das linguagens de marcação utilizadas na Web, o que inclui as famílias HTML e XHTML, MathML, SMIL e SVG (1.0 and 1.1). Cada uma das páginas baixadas teve seu código analisado por esse validador e acordo com o seu tipo de documento. Como resposta à uma validação, o sistema fornece o número total de erros e avisos total encontrados, além de suas respectivas descrições que não foram utilizadas no presente projeto. Em alguns casos o validador apresentava resultados inesperados considerados errados. Foi então criado o seguinte código de erros para discriminar esses casos:
• -1: Indica página que não será, ou que não pode ser aberta. Este tipo de saída deverá ser ignorada, não sendo escrito no banco de dados.
• -2: Indica página que não pode ser verificada, em geral devido a uma extensão indevida, ou a erros em geral que impossibilitem a identificação da encodificação dos caracteres em algum ponto do documento. Deve ser considerada como uma página com erros graves.
• -3: Indica página cuja resposta do servidor não pode ser identificada corretamente. Em geral isso é indicativo de erros no programa, e portanto deve ser escrito no Banco de Dados para verificação futura.
• -5: Indica página cujo nome é inválido, provocando assim um erro em sua leitura. Em geral, neste caso o teste de HTML não chegou a ser realizado.
• 0: Indica página válida, na qual nenhum erro, de natureza alguma, foi encontrado. Ou seja, é uma página que passou na validação de HTML W3C.
Um resumo descritivo dos dados sobre validação W3C das páginas Web está apresentado em cinco tabelas (E1-1, E1-2, E1-3, E1-4 e E1-5)
A partir da validação das páginas da Web que foi feita com o programa validador do W3C, foi realizada a consolidação dos valores retornados pelo validador, indicando o número de erros encontrados na página. A Tabela E1-1 apresenta os resultados gerais obtidos nesse teste. Pode-se observar que 6,91% das páginas estão isentas de erros. A Tabela E1-2 apresenta uma distribuição da quantidade de erros por página, considerando faixas de valores para propiciar uma melhor visualização de seu grau de incorreção.
Tabela E1-1: Indicador E1 - Validação W3C - Informações Gerais
-5 (%) | -3 (%) | -2 (%) | -1 (%) | 0 (%) | >0 (%) |
---|---|---|---|---|---|
0,0 | 0,0 | 0,0 | 0,9579 | 2,6008 | 96,3804 |
Tabela E1-2: Indicador E1 - Validação W3C - Erros por faixa
≥0 e <10 (%) | ≥10 e <20 (%) | ≥20 e <30 (%) | ≥30 e <40 (%) | ≥40 e <50 (%) | ≥ 50 e < 60 (%) | ≥60 e <70 (%) | ≥70 e <80 (%) | ≥80 e <90 (%) | ≥90 e <100 (%) | ≥100 (%) |
---|---|---|---|---|---|---|---|---|---|---|
68,1022 | 7,1468 | 5,5541 | 3,1623 | 2,4169 | 1,6418 | 1,1354 | 0,9253 | 0,6686 | 0,5894 | 7,6385 |
Como pode-se observar nos resultados apresentados, o volume de páginas com erros é elevado e, somente 6,91% do total foram validadas corretamente. Nota-se, também, que existe uma quantidade significativa de páginas com menos de 10 erros (30,48%), entretanto ainda existem outros 15,38% que apresentaram mais de 100 erros no procedimento de validação. Isso sugere que existe um montante significativo de páginas que podem ser facilmente corrigidas para ficar compatível com os padrões W3C.
A Tabela E1-3 apresenta informações de quantidade de erros média e desvio padrão agrupados por tipo de documento. Pode-se observar que o maior volume de erros ocorre nos tipos HTML 4.01 e XHTML 1.0, formatos populares atualmente.
Tabela E1-3: Indicador E1 - Erros W3C - Segmentação por Tipos de Documentos mais Populares
Tipo de Documento | Quantidade de Ocorrências (Páginas Web) | Média de Erros | Desvio Padrão |
---|---|---|---|
&ndash;//W3C//DTD HTML 4.0 Transitional//EN | 14 | 19,0 | 0,0 |
-//IETF//DTD HTML 3.2//EN | 5 | 27,0 | 6,0 |
-//IETF//DTD HTML//EN | 135 | 534,4889 | 1.047,0213 |
-//W3C//DTD HTML 3.2//EN | 68 | 82,2206 | 151,0119 |
-//W3C//DTD HTML 4.0 //EN | 2 | 23,5 | 9,5 |
-//W3C//DTD HTML 4.0 Strict//EN | 10 | 3,4 | 0,8 |
-//w3c//dtd html 4.0 transitional//en | 152 | 115,2829 | 1.117,9038 |
-//W3C//DTD HTML 4.01 Strict//EN | 2 | 147,0 | 146,0 |
-//W3C//DTD HTML 4.01//EN http://www.w3.org/TR/html4/strict.dtd | 2.581 | 23,9822 | 0,6907 |
-//W3C//DTD HTML 4//EN | 1 | 1,0 | 0,0 |
-//W3C//DTD HTML+RDFa 1.1//EN | 1.592 | 43,0427 | 1,2629 |
-//W3C//DTD W3 HTML 3.2//EN | 2 | 4,0 | 1,0 |
-//W3C//DTD XHTML 1.0 STRICT//EN | 36 | 18,4167 | 13,4296 |
-//W3C//DTD XHTML 1.0 Strict//EN http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd | 242 | 23,0 | 1,9855 |
-//W3C//DTD XHTML 1.0 Strict//PT | 144 | 79,6319 | 74,3217 |
-//W3C//DTD XHTML 1.0 Transitional//BR | 1 | 17,0 | 0,0 |
-//W3C//DTD xhtml 1.0 Transitional//EN | 31 | 13,0323 | 16,6685 |
-//W3C//DTD XHTML 1.0 Transitional//PT | 902 | 75,0732 | 19,4307 |
-//W3C//DTD XHTML 1.0 Transitional//PT-BR | 5.612 | 40,7655 | 28,8144 |
-//W3C//DTD XHTML 4.0 Transitional//EN | 1 | 36,0 | 0,0 |
-//W3C//DTD XHTML+RDFa 1.1//EN | 106.368 | 21,5906 | 23,0988 |
-//W3C//DTD XHTML; 1.0 Transitional//EN | 10 | 96,0 | 216,6749 |
//W3//DID HTML 3.2 Final//EN | 2 | 8,0 | 1,0 |
HTML 2.0 | 11 | 176,7273 | 145,5679 |
HTML 3.2 | 30.954 | 0,776 | 49,7284 |
HTML 4.0 Frameset | 131 | 9,916 | 6,6356 |
HTML 4.0 Strict | 71 | 35,9718 | 22,1448 |
HTML 4.0 Transitional | 8.442 | 37,1522 | 78,5797 |
HTML 4.01 Frameset | 1.261 | 27,5202 | 50,2687 |
HTML 4.01 Strict | 59.268 | 114,9877 | 158,5512 |
HTML 4.01 Transitional | 2.570.989 | 10,908 | 160,0102 |
HTML5 | 675.745 | 26,3473 | 62,1325 |
XHTML + RDFa | 23.271 | 47,536 | 53,3276 |
XHTML 1.0 Frameset | 1.416 | 8,4965 | 10,2959 |
XHTML 1.0 Strict | 208.256 | 53,4946 | 108,4309 |
XHTML 1.0 Transitional | 644.175 | 112,8226 | 259,6829 |
XHTML 1.1 | 4.902 | 100,4313 | 228,419 |
XHTML 1.1 plus MathML 2.0 | 1 | 1,0 | 0,0 |
XHTML Basic 1.0 | 11 | 5,8182 | 1,3361 |
XHTML Mobile Profile 1.2 | 2 | 2,0 | 0,0 |
XML | 529 | 1,8658 | 21,9379 |
A Tabela E1-4 apresenta estatísticas gerais acerca do indicador de validação W3C das páginas da Web.
Tabela E1-4: Indicador E1 - Erros W3C - Páginas HTML - Análise Estatística
Média | Min | Max | Mediana | Desvio Padrão | CV |
---|---|---|---|---|---|
32,5049 | 0 | 21.559 | 1,0 | 167,9708 | 5,16755908 |
A partir da análise estatística apresentada na Tabela E1-4 pode-se notar que a média de erros é de em torno de 73,9 por página (um aumento de 17,1% em relação ao último estudo, que tinha 63,11 erros na média), com um desvio padrão alto, o que faz com que o coeficiente de variação seja 3,43. Cabe ressaltar que as páginas inválidas foram desconsideradas na geração dessas estatísticas.
A Tabela E1-5 apresenta um recorte da validação W3C por unidades federativas. Os Estados de Roraima (41,9%), Maranhão (25,8%), Minas Gerais (18,1%), Paraíba (11,7%), e Acre (10,5%) merecem destaque por serem os estados que apresentaram melhor conformidade, com valores acima de 10%. Já o estado de Tocantins apresentou queda de 12,5% para 3,8% do estudo anterior para o atual. Já o Distrito Federal apresenta pior grau de conformidade com 0,69%.
Tabela E1-5: Indicador E1 - Validação W3C (Páginas HTML da Web) - Recorte por Unidade Federativa
UF | Não Conformidade | % Não Conformidade | Conformidade | % Conformidade |
---|---|---|---|---|
.GOV.BR | 963.481 | 97,2678 | 27.064 | 2,7322 |
.Outros | 894 | 99,1131 | 8 | 0,8869 |
AC | 48.080 | 97,2217 | 1.374 | 2,7783 |
AL | 70.507 | 98,5161 | 1.062 | 1,4839 |
AM | 20.710 | 97,5369 | 523 | 2,4631 |
AP | 23.286 | 90,6423 | 2.404 | 9,3577 |
BA | 98.307 | 94,7245 | 5.475 | 5,2755 |
CE | 51.935 | 97,0439 | 1.582 | 2,9561 |
DF | 26.227 | 97,7088 | 615 | 2,2912 |
ES | 83.086 | 97,2266 | 2.370 | 2,7734 |
GO | 35.982 | 93,45 | 2.522 | 6,55 |
MA | 15.446 | 98,8607 | 178 | 1,1393 |
MG | 242.652 | 94,7822 | 13.358 | 5,2178 |
MS | 24.999 | 94,2043 | 1.538 | 5,7957 |
MT | 42.614 | 96,5559 | 1.520 | 3,4441 |
PA | 74.713 | 98,4335 | 1.189 | 1,5665 |
PB | 91.748 | 95,9426 | 3.880 | 4,0574 |
PE | 49.731 | 94,7925 | 2.732 | 5,2075 |
PI | 8.764 | 99,8746 | 11 | 0,1254 |
PR | 228.778 | 97,0447 | 6.967 | 2,9553 |
RJ | 86.114 | 97,2699 | 2.417 | 2,7301 |
RN | 15.655 | 98,6266 | 218 | 1,3734 |
RO | 41.673 | 97,9665 | 865 | 2,0335 |
RR | 14.362 | 99,4529 | 79 | 0,5471 |
RS | 188.084 | 97,3862 | 5.048 | 2,6138 |
SC | 744.274 | 99,2021 | 5.986 | 0,7979 |
SE | 57.364 | 94,9594 | 3.045 | 5,0406 |
SP | 897.935 | 98,008 | 18.250 | 1,992 |
TO | 30.462 | 93,9837 | 1.950 | 6,0163 |
Em relação aos resultados com a pesquisa anterior do Censo da Web Governamental Brasileira (2012), constatou-se que ocorreu um aumento no volume médio de erros por página, que foi de 63,11 para 73,9. Porém no primeiro estudo (2010) o valor era 82,23. Além disso, a mediana caiu de 22 para 16 erros, indicando que o aumento na média de erros por página não reflete o conjunto como um todo, já que nas 50% páginas com menos erro, o valor médio de erros recuou. A quantidade de erros medida na validação das páginas da Web foi bastante alta, porém existe a necessidade de entender melhor como o procedimento de validação é realizado e que tipos de erros foram identificados. A validação parece ser bem restritiva, de forma que um indicador de erro deve propagar o erro em outros testes. Isso é uma característica intrínseca do validador utilizado e, consequentemente, das linguagens de marcação. Por outro lado, é importante destacar que os erros apontados não significam que os sítios Web não funcionam, mas indicam que eles não estão preparados para uma permitir um melhor desempenho das aplicações de visualização de conteúdo. Isso sugere a importância de se criar políticas e incentivos ao aumento do grau de aderência aos padrões Web. A adoção de ferramentas de publicação e gestão de conteúdo pelas entidades governamentais pode possibilitar uma melhor padronização e uso dos recursos tecnológicos de forma a atender às recomendações definidas pelo W3C.