Declaro aberta a temporada de críticas, sugestões e cuspes. heheh
Com a devida autorização do meu orientador, o ótimo professor João Batista, vou postar uma parte do meu TCC que fala sobre o histórico do HTML e World Wide Web, desde os primórdios até hoje em dia.
Não aprofundei muito, pois não é o objetivo do meu trabalho.
Minha dificuldade principal foi conseguir fontes oficiais sobre o assunto, o que acabou gerando um excesso de referências bibliográficas e um verdadeiro trabalho de montagem de quebra-cabeças por minha parte. Espero que no futuro eu melhore.
Aguardo também críticas e sugestões sinceras e sem medo por parte da comunidade.
(Será mesmo que alguém irá ler este texto gigantesco??? Acredito que servirá mais como uma referência de histórico caso alguém precise no futuro.)
Lembrando que a formatação visual, itálicos, etc e organização do índice de referências, siglas, etc não vão ficar por minha conta, mas sim do meu colega de TCC, por isso este texto possa parecer meio feio inicialmente. Também não tive tempo de ativar os links no índice de referências...
Acredito que este texto possa se tornar um referencial caso algum de vocês precise de um histórico do html ou da web. Aguardo comentários.
Té mais...
Introdução
O HTML (HyperText Markup Language - .............) é mundialmente reconhecido como linguagem padrão para publicação de conteúdo na WWW (Word Wide Web - ................) [18]. É uma linguagem de marcação [1] para hipertextos [2] baseada no SGML (Standard Generalized Markup Language - .................). [3]
HTML é usado para estruturar e estilizar informação definindo blocos de texto como parágrafos, cabeçalhos, listas, textos em negrito, sublinhado. Por ser escrito em texto ASCII (............ - .............), pode ser desenvolvido e processado por uma variedade de ferramentas: desde editores simples de texto a sofisticados editores visuais, baseados no conceito WYSIWYG (What You See Is What You Get - ................) [24]. Os programas utilizados para processar e exibir a página ao leitor são chamados de navegadores ou browsers.
Atualmente a família de linguagens HTML se encontra sob padronização da W3C (World Wide Web Consortium)[11] e está em conformidade com a ISO (International Standard Organization - ............) ISO 8879. [18]
XHTML (............. - .............) é o sucessor do HTML [20]. Os documentos da família XHTML reformulam os documentos HTML 4 de forma a se tornarem compatíveis com a especificação XML (eXtensible Markup Language - ...........) [21]. A versão 1.0 do XHTML também procura ser compatível com aplicações leitoras de HTML 4, facilitando, assim a transição entre as especificações. [18]
Histórico da World Wide Web
O físico inglês Sir Timothy John Berners-Lee, trabalhando no CERN [4] na década de 1980, foi responsável por inventar a World Wide Web, o HTML e o primeiro servidor HTTP (HyperText Transfer Protocol - ..............), baseado na idéia do hipertexto.
Importante notar que a idéia de hipertexto e links entre documentos não foi criada por Berners-Lee.
Em 1945, Vannevar Bush, vendo o problema de gerenciar e acessar as novas quantidades de informações que surgiam, propõe um sistema baseado em associações, idêntico ao praticado pelo cérebro humano [8]. Ele descreveu um sistema chamado Memex que permitia seguir ligações entre documentos armazenados em microfilme. [5][6]
Outro desenvolvedor importante para o hipertexto foi Douglas Engelbart (atualmente é diretor do Bootstrap Institute (www.bootstrap.org)). Este produziu um sistema chamado NLs (oNLine System - .........) que permitia seguir links em documentos de texto. Procurando tornar o sistema mais prático ele acabou inventando o mouse. Porém, apesar desta nova facilidade, o NLS acabou não tendo um grande sucesso devido à dificuldade de uso. [5][8]
Em 1965, Ted Nelson utiliza pela primeira vez o termo hipertext e hipermídia. Nos anos seguintes, tentou promover um sistema global de hiperlinks chamado Xanadu. [5][6][8]
O primeiro sistema popular para hipertextos foi desenvolvido por Bill Atkinson em 1987 e chamado de HyperCard [6]. Distribuído pela Apple Computer, ele permitia o desenvolvimento de aplicações gráficas baseadas em hipertextos de forma facilitada. [6][8]
Já em 1980, Berners-Lee propôs ao CERN (............ - .............) um projeto baseado no conceito de hipertexto para facilitar o compartilhamento de informações entre os desenvolvedores e cientistas. Juntamente com Robert Cailliau, Berners-Lee desenvolveu um sistema chamado Enquire-Within-Upon-Everything (popularmente conhecido apenas como ENQUIRE) [13] que permitia estabelecer ligações entre diversos nós [5][6]. Este sistema serviu apenas para o uso pessoal de Berners-Lee. [25]
Em 1989, o CERN havia se tornado o maior site da Internet na Europa [12], e Tim Berners-Lee encontrou um ambiente favorável para unir o hipertexto à Internet. No mês de março daquele ano, ele escreve Information Management: A Proposal (versão histórica disponível em http://www.w3.org/History/1989/proposal.html), onde descreve as vantagens do sistema baseado no hipertexto e envia aos seus superiores no CERN. Ele pretendia facilitar o acesso às diversas informações científicas dispersas geograficamente na rede do CERN. [5][12]
Em outubro de 1990, Berners-Lee reformula seu projeto com o auxílio de Robert Cailliau. Eles começam a trabalhar na implementação de um editor e leitor (navegador) que recebeu o nome de World Wide Web [5][12]. Este software foi concluído em 1991, portado para outras plataformas e liberado ao público. [5][6][12]
Em 1990 também foi definida a versão inicial do Protocolo de Transferência de Hipertexto [14] entre cliente e servidor. Esta versão inicial ficou conhecida como HTTP 0.9 [15]. Berners-Lee implementou este protocolo no software que chamou de HTTPD (............. - .......................), e a primeira página web ficou disponível através da URL (.................. - ..................) [16] http://nxoc01.cern.ch/hypertext/WWW/TheProject.html . [5][12]
Naquele período, muitas pessoas estavam usando TeX[9] e PostScript[10] para seus documentos. Alguns estavam usando SGML (................. - .................) [3]. O HTML foi concebido como uma solução muito simples e foi combinado com o HTTP, um protocolo de rede também muito simples. [6]
Uma vez que os conceitos de Berners-Lee se tornaram públicos, principalmente através do grupo de discussão WWW-talk, lista de e-mail iniciada em setembro de 1991 [25], outras pessoas contribuíram para o crescimento da World Wide Web. Vários Web sites foram configurados e novos navegadores foram desenvolvidos como libwww, Viola, MidasWWW, Samba, Erwise, Lynx e Arena. [6][12][17][25]
Em fevereiro de 1993, Marc Andreesen, estudante da NCSA (National Center for Supercomputing Applications - ...................) da Universidade de Illinois, junto com Eric Bina, expandiram o potencial gráfico da World Wide Web lançando a primeira versão do browser Mosaic for X. Em setembro de 1993 foram finalizadas versões do Mosaic para Microsoft Windows e Apple Macintosh. [5][12][17][22]
Este foi um evento significativo na evolução da WWW. Pela primeira vez havia um cliente Web relativamente fácil de usar e disponível para três dos sistemas operacionais mais populares daquele tempo. [12]
Ainda em 1993, em abril, o CERN torna o protocolo HTTP livre, permitindo que qualquer pessoa o utilize de graça, e em setembro, os backbones da NSF (......... - ...........) registram que 1% de seu tráfego foi consumido pela porta 80, do protocolo http. [22]
Desta forma, a Web crescia exponencialmente, junto com outros serviços da Internet [6] e o HTML deveria acompanhar. Com a evolução visual iniciada pelo Mosaic, vários navegadores foram desenvolvidos e várias tags novas eram criadas. [6][7]
A primeira evolução do HTML veio através de Dave Raggett da Hewlett-Packard. Ele era um dos entusiastas da lista de discussão do WWW-talk e se encontrou com Tim Berners-Lee em 1992, quando os dois se uniram pra considerar que características deveriam ser adicionadas ao HTML de forma a torná-lo mais atrativo para o público em geral [25]. Ao retornar à Inglaterra, Dave Ragget escreveu o HTML+, uma versão mais rica do HTML original de Berners-Lee [25]. Com o HTML+ veio o suporte a tabelas, imagens captionadas (com uma legenda abaixo), formulários (elemento para que o leitor digite alguma informação e a envie para processamento), uma proposta para estilizar fórmulas matemáticas e alguns elementos foram colocados em containers (com tags de fechamento), entre outras alterações [7]. A versão original do HTML+ pode ser acessada no endereço http://www.w3.org/MarkUp/HTMLPlus/htmlplus_1.html datado de Novembro de 1993 e sua revisão pode ser acessada em [7].
Em maio de 1994, foi realizada a primeira conferência da World Wide Web em Genebra, organizada pelo CERN, tendo a comunidade acadêmica como participante em sua maioria. Em setembro o IETF (Internet Engineering Task Force - .............) [26] criou seu grupo de trabalho para o HTML (este grupo foi posteriormente fechado em 1996). [20] [25]
Desde o desenvolvimento do Mosaic, vários navegadores adicionavam suas próprias tags ao HTML, dificultando esforços de padronização [25]. Neste cenário, em julho de 1994, Dan Connolly, que esteve presente na conferência de Genebra discursando sobre a Interoperabilidade, uniu todas as tags que estavam sendo utilizadas e preparou um rascunho do HTML 2 (RFC 1866). Este rascunho circulou para comentários e sugestões através da Internet. A versão final do HTML 2 data de setembro de 1995 e está disponível na URL http://www.w3.org/MarkUp/html-spec/html-pubtext.html. [20][25]
Ainda assim, este padrão não foi totalmente respeitado. Em Novembro de 1993, vários desenvolvedores do Mosaic montaram sua própria empresa e lançaram o navegador Netscape [12][22][25]. Este navegador teve um imenso sucesso, porém seus desenvolvedores não freqüentavam conferências de padronização da Web e, assim, o Netscape prosseguiu criando suas próprias tags e dificultando os esforços de padronização. [25]
Em outubro de 1994, o W3C (World Wide Web Consortium - .............) foi fundado, realizando seu primeiro encontro em dezembro daquele ano [12][22]. O grupo, que atualmente tem Tim Berners-Lee como diretor, é formada por alguns especialistas na área e por empresas do setor e possui como objetivo principal promover padrões para evolução da Web e interoperabilidade entre produtos, produzindo especificações e softwares de referência. [12]
Mesmo com a formação da W3C, novas tags, atributos e propriedades continuaram a ser criados. Novos atributos criados como BGCOLOR e tags como FONT FACE, voltados ao aspecto visual, iam contra a proposta inicial do HTML que era apenas de estruturar e organizar o conteúdo. [25]
Em março de 1995, Dave Ragget publica um rascunho da versão 3 do HTML e a conclui em setembro do mesmo ano. A principal mudança apresentada pela proposta relativa à metodologia tableless, foi a padronização da tag STYLE e do atributo CLASS que permitiriam adicionar estilização externa ao HTML através de folhas de estilo, as chamadas CSS (Cascading Style Sheets - .............) [25]. O CSS estava em seu desenvolvimento inicial e ainda não era uma recomendação da W3C [27], mas poderia se tornar uma alternativa às tags visuais que haviam sido criadas, fazendo com que o HTML retornasse a seu objetivo original que era apenas estruturação. As recomendações atuais da W3C para o XHTML (........... - ..............) mostram que o CSS alcançou este objetivo [19]. A recomendação está disponível em http://www.w3.org/MarkUp/html3/CoverPage.html.
Mesmo com este avanço em relação a separar a estilização do código HTML, foi neste período que as tabelas começaram a ser erroneamente usadas com o propósito de formatar e organizar visualmente uma página na tela [25]. A revisão 3.2 foi a primeira recomendação publicada pela W3C para o HTML e pode ser acessada através da URL http://www.w3.org/TR/REC-html32 [20]. Mesmo tendo sido bem aceita aceito, os navegadores da época continuaram a não implementar corretamente o HTML 3, apesar de proclamarem o contrário [25]. Como prova disto, em setembro de 1995, a Netscape envia uma proposta sobre frames (divisões na tela do browser), porém a implementa antes de ser aprovada. [25]
Este cenário piorou quando, em agosto de 1995, foi lançado o browser Internet Explorer da Microsoft e iniciada a chamada "Guerra dos browsers". Disposta a conquistar o mercado até então dominado pelo Netscape, a Microsoft embutiu o navegador em seu sistema operacional Windows. Os dois rivais, Netscape e Internet Explorer, buscando mostrar superioridade um sobre o outro, criaram funcionalidades que não estavam previstas nos padrões recomendados pela W3C. Assim surgiram novas tags, atributos, elementos embutidos, plug-ins (encaixes para que outros programas pudessem rodar direto do browser) e formas de rodar scripts direto do navegador. [17][25]
Em novembro de 1995 dois passos importantes foram dados. O W3C inicia suas discussões sobre as folhas de estilo em cascata CSS que permitiriam adicionar estilização final ao documento HTML, independente de tags com funções visuais. Foram também iniciados esforços para estender a capacidade do HTML 2 de forma a remover as restrições de caracteres, visando a internacionalização da Web. [25]
Seguindo o sucesso dessa reunião, a W3C decidiu formar, em fevereiro de 1996, um grupo de revisão editorial para o HTML chamado HTML Editorial Review Board ou ERB (em dezembro de 1996, passou a se chamar HTML Working Group). Este grupo, gerenciado por Dan Connolly, era formado por representantes da IBM, Microsoft, Netscape, Novell, Softquad e do próprio W3C, e tinha como objetivo reforçar o estabelecimento dos padrões Web de forma a tentar eliminar as incompatibilidades do HTML, algo difícil de se realizar naquele período [25]. Desenvolvedores de browsers naquela época, particularmente a Netscape, tinham a idéia de que se os usuários gostassem de uma inovação, o mercado a iria exigir, e esta inovação iria se tornar um padrão de fato [25]. Naquele tempo, esta idéia de inovação pareceu absolutamente certa, porém era justamente isso que Dave Raggett e o W3C tentavam evitar. [25]
Em janeiro de 1997, o HTML Working Group lança a primeira versão do HTML revista e aceita por todas as organizações membro: o HTML 3.2, disponível em http://www.w3.org/TR/REC-html32.html. [25]
Mesmo com esta nova especificação, a popularização dos padrões Web ainda estava longe de ocorrer, em parte devido aos próprios desenvolvedores de sites que, em sua maioria, já haviam se acostumado com editores visuais, layouts baseados em tabelas e tags não padrão como MARQUEE e BLINK.
Reforçando este cenário, a partir de 1998 o navegador Netscape começa a perder o domínio do mercado, e o Internet Explorer, que havia sido integrado no sistema operacional da Microsoft, inicia seu domínio no mercado de navegadores, que dura até hoje. O navegador da Microsoft, atualmente em sua versão 6.0, ainda conta com cerca de 60% do mercado e vêm perdendo espaço para novos browsers mais complacentes com os padrões como o Firefox e Opera.
A idéia inicial do HTML, que propunha a separação entre a apresentação visual de uma página de seu conteúdo, e os esforços de padronização, voltaram a ganhar força novamente no mundo dos desenvolvedores Web apenas após a popularização de novos dispositivos com acesso à Internet como celulares e palms. Estes dispositivos teriam dificuldades ao renderizar o HTML da forma que era desenvolvido, devido à suas limitações de memória e processamento. O W3C então, começou a preparar outra nova versão para o HTML. Pessoas com limitações físicas, visuais ou auditivas, também entraram no foco do W3C e, em abril de 1998 foi lançada a versão 4.0 do HTML [29]. Nesta versão, o W3C recomendava com mais ênfase a utilização de folhas de estilo para apresentação, introduzia atributos para usuários com dificuldade, entre outras características. [29]
Em agosto de 1999, foi lançada a revisão 4.01 do HTML [31] corrigindo erros de sua versão anterior. Este é a recomendação atual para o HTML. [20]
Em fevereiro de 1998, houve o desenvolvimento de uma nova linguagem para marcação de dados: o XML [21]. A facilidade de uso e customização desta linguagem, a tornou rapidamente difundida para a realização de troca de dados entre aplicações distintas. A linguagem não descrevia a apresentação visual dos dados, mas apenas sua marcação. Isto, aliado à grande aceitação que o XML teve, fez com que o W3C o utilizasse para auxiliar a criar uma versão mais interoperável do HTML: o XHTML.
A primeira recomendação XHTML (XHTML 1.0) data de 26 de janeiro de 2000. A W3C se refere ao XHTML como uma reformulação do HTML 4 em XML 1.0 [32] e o considera a maior mudança no HTML desde a versão 4.0 de 1997 [20]. O XHTML é entendido como uma modificação do HTML 4.1 de forma estar de acordo com as regras XML e poder ser validado como tal. Desta forma, o XHTML pode ser interpretado tanto por navegadores que suportam o HTML 4 quanto por qualquer aplicação leitora de XML [20] e reforçou ainda mais os quesitos de interoperabilidade, acessibilidade, organização das tags, separação entre conteúdo, apresentação visual e comportamento, além de facilitar o processo de renderização da página devido à rigidez do XML.
Agora, o índice de referências (lembrando que a organização destas referências, siglas, etc será feita pelo meu colega. Aqui tá bem crú.):
Índices
[1] markup languagem - linguagem que combina texto e informações extra sobre o texto
[2] sistema para visualização de informação cujos documentos contêm referências internas para outros documentos, chamados de hiperlinks ou links
[3] Standard Generalized Markut Language - metalinguagem através da qual se pode definir linguagens de marcação para documentos. A SGML é uma descendente da Generalized Markup Language (GML) da IBM, desenvolvida na década de 60 por Charles Goldfarg, Edward Mosher e Raymond Lorie (cujas iniciais dos nomes próprios por acaso coincidem com GML). A SGML não deve ser confundida com a Geography Markup Language (GML) desenvolvida pelo consórcio Open GIS. A SGML providencia uma variedade de sintaxes de marcação que podem ser usadas por várias aplicações. Ao alterar a Declaração SGML, deixa de ser necessário recorrer aos caracteres "<" e ">", apesar de serem o padrão.
A SGML é uma norma ISO: "ISO 8879:1986 Information processing--Text and office systems--Standard Generalized Markup Language (SGML)".
HTML e XML são ambas derivadas do SGML. Enquanto a HTML é uma aplicação da SGML. Outra linguagem de marcação criada originalmente como uma aplicação da SGML é DocBook, desenhada para a edição de documentação técnica - COPIADO de: http://pt.wikipedia.org/wiki/SGML
Referência: http://www.w3.org/MarkUp/SGML/
[4] CERN - Organização Europeia para Investigação Nuclear, em inglês "European Organization for Nuclear Research" e em francês "Organisation Européenne pour la Recherche Nucléaire". O acrônimo CERN refere-se ao antigo nome em francês, "Conseil Européen pour la Recherche Nucléaire".
[5] http://www.deei.fct.ualg.pt/ADI/web-history.pdf
[6] http://www.w3.org/MarkUp/historical
[7] http://www.w3.org/MarkUp/htmlplus_paper/htmlplus.html
[8] http://www.icmc.usp.br/~helder/projects/task1.html
[9] Tex - sistema de processamento de textos desenvolvido por Donald E. Knuth onde há separação entre conteúdo e formatação visual - http://www.tex-br.org/
[10] PostScript - linguagem de representação de dados. Utilizada para descrever o layout e estrutura da página para o dispositivo de impressão ou para o monitor. - http://pt.wikipedia.org/wiki/PostScript - 15:12 16/05/2006
[11] O World Wide Web Consortium (W3C), é um consórcio internacional de empresas de tecnologia fundado em 1994 por Tim Berners Lee que trabalha para o desenvolvimento de padrões de compatibilidade na Web. - http://www.w3.org/Consortium/ - 15:12 16/05/2006
[12] http://ei.cs.vt.edu/~wwwbtb/book/chap1/index.html - 15:11 16/05/2006
[13] http://infomesh.net/2001/enquire/manual/ - 15:11 16/05/2006
[14] HTTP - FALAR SOBRE O HTTP
[15] http://www.w3.org/Protocols/HTTP/AsImplemented.html - 15:11 16/05/2006
[16] URL - Universal Resource Locator - FALAR SOBRE O URL
[17] http://www.dejavu.org/ - histórico dos browsers - 16:06 16/05/2006
[18] http://www.maujor.com/w3c/xhtml10_2ed.html - tradução das normas w3c 10:29 17/05/2006
[19] http://www.maujor.com/blog/2006/03/14/tutorial-xhtml/ - 09:55 17/05/2006
[20] http://www.w3.org/MarkUp/
[21] XML - Extensible Markup Language - Linguagem mais simples e flexível derivada do SGML, utilizado para armazenamento e troca de dados. É um perfil - um subconjunto específico da SGML, projectada para ser mais simples de se analisar gramaticalmente e de se processar do que SGML. O XML permite que o desenvolvedor crie tags e atributos para escrever seu próprio documento. - http://www.w3.org/XML/ - 16:00 3/6/2006
[22] http://www.w3.org/History.html
[23] National Science Foundation - NSF - falar da NSF.
[24] WYSIWYG - FALAR O QUE É
[25] http://www.w3.org/People/Raggett/book4/ch02.html
[26] IETF - FALAR SOBRE O IETF
[27] http://www.w3.org/Style/LieBos2e/history/ - CSS
[28] http://www.blooberry.com/indexdot/history/netscape.htm - 16:19 3/6/2006
[29] http://www.w3.org/TR/1998/REC-html40-19980424/ - HTML 4 - 19:47 3/6/2006
[30] http://www.w3schools.com/browsers/browsers_stats.asp - estatísticas de utilização de browser - 20:29 3/6/2006
[31] http://www.w3.org/TR/html4/ - HTML 4.1 - 20:39 3/6/2006
[32] http://www.w3.org/TR/xhtml1/ - XHTML 1.0 - 20:44 3/6/2006
Gostou da dica acima? Então clica nos botões de compartilhamento abaixo e me ajude a dica a subir no Google.