El World Wide Web es un sistema gobal de hipertexto desarrollado inicialmente en 1989 por Tim Berners Lee en el Laboratorio Europeo de Física de Partículas, ("European Laboratory for Particle Physics, CERN") en Suiza. En 1993 el Web comenzó a crecer rápidamente, principalmente gracias a la NCSA ("National Center for Supercomputing Applications"), que desarrolló un navegador Web llamado Mosaic, una aplicación basada en X Windows. Esta aplicación proporcionó la primera interfaz gráfica de usuario al Web, haciendo la navegación más asequible
Hoy en día existen navegadores y servidores Web disponibles para casi todas las plataformas. Se pueden conseguir gratis, vía FTP, o comprando una copia con licencia. El rápido crecimiento de la popularidad del Web se debe a la flexibilidad con la que la gente puede navegar a través de recursos de todo el mundo en Internet, así como descargarlos de la red. Para hacerse una idea del crecimiento del Web, aquí hay algunas estadísticas:
El número de servidores Web está creciendo con gran rapidez(entre 50 y 100 cada día) y el tráfico en el puerto 80, que es el puerto Web bien conocido, de la troncal NSF experimenta igualmente un crecimiento fenomenal.
Ya hay bastantes compañías haciendo negocio en el Web. Se pueden encontrar prospectos ofertas de productos, y por supuesto, pedidos, en todo el Web. La mayoría de las multinacionales tienen un servidor Web para distribuir información específica de sus productos, documentos o simplemente para ponerse en contacto con clientes. Una página es sólo el término Web para un documento y la página particular/personal un punto de partida para una colección de documentos. Es, si se desea, la tabla de contenidos de un sitio Web. Desde allí se puede explorar y buscar con facilidad en todo el Web.
Presentar un documento en forma de hipertexto tiene ciertas ventajas para el usuario. Por ejemplo, si se quiere más información acerca de un tema concreto que se haya mencionado, suele ser posible hacer click sobre él para leer más detalles al respecto. Los temas con un enlaces a otro documento se pueden identificar fácilmente al estar resaltados. De hecho, los documentos pueden ser y son enlazados con frecuencia a otros documentos de autores completamente distintos, como si fueran notas a pie de página, pero en las que el gráfico o documento se muestra inmediatamente. Un documento en el Web podría incluir enlaces a otros documentos localizados en diferentes sitios Web. Al activar el enlace, casi siempre con un click del ratón, el documento se recupera del correspondiente servidor y se muestra automáticamente. Este documento podría a su vez incluir enlaces a otros recursos, y así sucesivamente.
El protocolo estándar de comunicaciones entre servidores y clientes Web es el HTTP("Hypertext Transfer Protocol"), que es un borrador de estándar de Internet. El HTTP es un protocolo orientado a objetos genérico y sin estado. El IETF ha establecido un grupo de trabajo para mejorar su eficacia. Los navegadores pueden usar además otros protocolos como el FTP, Gopher, WAIS y NNTP ("Network News Transfer Protocol") por ejemplo. Por ello, no hace falta un cliente determinado para conseguir acceso a todos estos otros recursos que también están disponibles en la red. El modo en que los navegadores pueden diferenciar entre todos estos protocolos y qué protocolos son los que soportan se explica posteriormente en esta sección.
Una transacción HTTP consiste básicamente en:
Para una descripción más detallada de HTT, remitirse a los documentos del grupo de trabajo del IETF.
El lenguaje estándar de marcas para documentos Web es HTML ("Hypertext Markup Language"), que es un borrador de estándar de Internet y actualmente varios grupos de trabajo del IETF están trabajando en él. HTMP es una aplicación de SGML("Standard Generalized Markup Language"). Para crear un documento Web hay que usar las marcas HTML que constituyen la estructura lógica del documento, por ejemplo, cabeceras, listas y párrafos. Aquí se muestran algunas marcas para definir enlaces a otros documentos o para embeber una imagen en el texto.
<HTML> <!-- Begin of document --> <HEAD> <!-- A sample document --> <TITLE>This is a Sample</TITLE> </HEAD> <!-- End of the heading section --> <BODY> <!-- Begin of text body --> <H1>First Header</H1> <P>The first paragraph. <UL> <!-- unordered list --> <LI>Item one </UL> <!-- End of list --> </BODY> <!-- End of text body --> </HTML> <!-- End of document -->
Si quieres iniciarte en HTML, puedes ver el siguiente documento: http://info.cern.ch/hypertext/WWW/MarkUp/MarkUp.html.
Todos los documentos, imágenes, clips de audio o de vídeo se denomina recurso Web Para identificar el método de acceso a estos recursos el Web emplea URLs("(Uniform Resource Locators). URL es un protocolo estándar de Internet y se puede encontrar en el RFC 1738. El contexto global para construir nuevos esquemas para codificar nombres y direcciones de objetos en Internet se describe en el RFC informacional 1630. Este RFC acuña el término URI(Universal Resource Identifiers) como un modelo más teórico para diseñar estos esquemas. Los URIs que se refieren a una dirección objeto(dirección IP e información de la ruta de acceso)mapeados a un método de acceso conocido usando un protocolo de red existente como HTTP o FTP se conocen como URLs. Por lo tanto, un URL es una forma específica de un URI. En general, los URLs se escriben del modo siguiente:
<scheme>:<scheme-specific-part>
Un URL contiene el nombre del esquema usado(<scheme>) seguido de una coma y una ristra(<scheme-specific-part>) cuya interpretación depende del esquema. Los sigs esquemas los cubre el RFC, y les pueden seguir otros en el futuro:
Mientras que la sintaxis para el resto del URL puede variar dependiendo del esquema seleccionado, los esquemas que implican el uso directo de un protocolo basado en IP usan una sintaxis común para la parte <scheme-specific data>, que comienza por "//" para indicar que sigue la sintaxis estándar de Internet:
//<user>:<password>@<host>:<port>/<url-path>
Algunas o todas de las partes "<user>:<password>@", ":<password>", ":<port>", and "/<url-path>" se pueden excluir.
El "url-path" al final proporciona detalles de cómo acceder el recurso especificado. Nótese que el "/" entre el host(o puerto) y el "url-path" no forma parte del "url-path".
Según la definición anterior, el URL de HTTP tiene este aspecto:
http://<host>:<port>/<path>?<searchpart>
Donde:
La sintaxis para los demás esquemas como FTP y Gopher, por ejemplo, se explican en el RFC 1738.
Hay tres formas de acceder a la Web:
Es la mejor opción, aunque la LAN debe tener acceso a Internet. En la mayoría de los casos estas redes no tienen acceso directo a Internet, sino que se conectan a través de un cortafuegos. En este caso hay que especificar un servidor SOCKS o un proxy en el que el host se registra para obtener el acceso. Otra forma de conectarse es con el protocolo SLIP.
Los navegadores están disponibles para la mayoría de las plataformas. Para conseguir una lista de sitios FTP que los proporcionan y otras informaciones útiles, ir a ftp://rtfm.mit.edu/pub/usenet/news.answers/www/faq.