Si usted tiene un Web site bien diseñado y bien optimizado con el contenido rico de la palabra clave a atraer los visitantes y los motores de la búsqueda que es realmente grande solamente usted faltan algo que es muy importante. ¿Usted sabe cuáles es eso? Ése es archivo de Robots.txt.

el archivo de Robots.txt tiene porciones de importancia mientras que permite que las arañas o las correas eslabonadas permitan o que rechacen arrastrarse todas las páginas de un Web site o de un Web page particular. La gente tiene a veces ciertos datos confidenciales sobre su Web site y usando el archivo de robots.txt pueden restringir las correas eslabonadas o la araña para no arrastrarse o para no poner en un índice que la página particular así que nadie pueden alcanzar en esa página y de esta manera los datos confidenciales en esa página serán seguros.

Mientras que va a arrastrarse un Web site o las arañas o las correas eslabonadas de un Search Engine del Web page busque a menudo un fichero especial que se llame archivo de Robots.txt porque con Search Engine del archivo de robots.txt las arañas o las correas eslabonadas vienen saber sobre qué Web pages de ese Web site tienen que arrastrarse o poner en un índice y qué Web pages tienen que no hacer caso.

el archivo de Robots.txt es un archivo de texto simple que se debe colocar en directorio de raíz de un Web site. Por ejemplo:

el archivo de Robots.txt debe estar como como

http://www.abc.com/robots.txt

Crear el archivo de Robots.txt:

Según lo mencionado anteriormente, el archivo de robots.txt es un archivo de texto simple y usted puede crearlo abriendo un editor de textos simple como la libreta. Los datos o un comando mencionados en el archivo de robots.txt se llama como registra.

Un expediente incluye la información de un Search Engine particular y cada expediente tiene agente de usuario de dos campos donde usted menciona que es el nombre de las robustezas o de la araña y el otro campo rechazan las líneas que pueden ser uno o más donde usted tiene que mencionar el de que las páginas o los archivos tengan que ser no hechos caso. Por ejemplo:

Usuario-agente: googlebot
Rechace: /cgi-bin/

En robots.txt antedicho del ejemplo el archivo permite el googlebot que es la araña del Search Engine del Search Engine importante Google a arrastrarse cada página del Web site excepto de archivos del directorio del cgi-compartimiento. El googlebot de los medios tiene que no hacer caso de todos los archivos del directorio del cgi-compartimiento.

Y si usted entra como abajo:

Usuario-agente: googlebot
Rechace: /support

Googlebot no se arrastrará ninguÌn archivo del directorio de la ayuda pues el archivo de robots.txt tiene instrucciones al googlebot de no arrastrarse cualquier archivo del directorio de la ayuda.

En caso de que usted licencia rechace el espacio en blanco del campo entonces indicará al googlebot para arrastrarse todos los archivos del Web site. Pero en todo caso usted debe tener un campo del rechazo para cada agente de usuario.

Los todos ejemplo antedicho estaban solamente para el googlebot pero si usted quiere dar las mismas derechas a todo el las arañas del otro Search Engine después utilizan el asterisco (*) en vez de googlebot en campo del agente de usuario. Por ejemplo:

Usuario-agente: *
Rechace: /cgi-bin/

En ejemplo antedicho * representa todas las arañas del Search Engine y el archivo de robots.txt antedicho permite que todas las arañas del Search Engine se arrastren cada página del Web site excepto de archivos del directorio del cgi-compartimiento. Significa que todas las arañas de diversos motores de la búsqueda tienen que no hacer caso de todos los archivos del directorio del cgi-compartimiento.

Si usted quiere saber los nombres de agente de usuario para otros motores de la búsqueda entonces usted puede encontrarlo en sus ficheros de diario comprobando para saber si hay peticiones a robots.txt. Lo más a menudo posible, todas las arañas del Search Engine deben ser dadas las mismas derechas. en ese caso, utilice el Usuario-agente: * según lo mencionado anteriormente.

Soluciones de Webexcel (9001:2000 de la ISO certificado) una compañía del desarrollo de programas y una compañía de SEO


Etiquetas de la palabra clave: , ,

Postes relacionados


Ningunas respuestas a la importancia de usar el archivo de Robots.txt  

  1. Ningunos comentarios

Deje una contestación