El rastreador, también denominado "araña" o "robot", es el software que usa Google para procesar e indexar el contenido de las páginas web. El rastreador de Ad Manager visita su sitio para determinar su contenido y proporcionar anuncios relevantes.
A continuación encontrará algunos aspectos importantes sobre el rastreador de Ad Manager que debe conocer:
- El rastreador de Ad Manager no es el rastreador de Google. Los dos rastreadores son independientes el uno del otro, pero comparten la caché. De este modo, se impide que ambos soliciten las mismas páginas, con lo que los editores pueden ahorrar en ancho de banda. El rastreador de Herramientas para webmasters de Google también es independiente.
- Solucionar problemas de rastreo de Ad Manager no resuelve los problemas de rastreo de Google. Su posición en los resultados de búsqueda de Google no cambia al resolver problemas con el rastreador de Ad Manager. Para obtener más información sobre el posicionamiento de su sitio en Google, consulte al artículo sobre cómo incluir sitios web en los resultados de búsqueda de Google.
- El rastreador indexa por URL. Nuestro rastreador obtiene acceso a site.com y a
www.site.com
por separado. Sin embargo, no cuentasite.com
ysite.com/#anchor
como URLs distintas. - El rastreador no accede a las páginas ni a los directorios bloqueados por un archivo robots.txt. Tanto el rastreador de Google como el de partners de Ad Manager respetan los archivos robots.txt de los editores. Si su archivo robot.txt prohíbe el acceso a unas páginas o a unos directorios determinados, estos no se rastrean.
Tenga en cuenta que aunque sirva anuncios en páginas que usan la línea
User-agent: *
para no permitir el rastreo a robots, el rastreador de Ad Manager seguirá rastreando esas páginas. Para evitar que el rastreador de Ad Manager acceda a sus páginas, debe especificar la líneaUser-agent: Mediapartners-Google
en el archivo robots.txt.Obtenga más información sobre cómo dar acceso al rastreador en el archivo robots.txt.
- El rastreador únicamente intentará acceder a las URLs en las que se hayan implementado nuestras etiquetas de anuncios. Solo las páginas que muestren anuncios de Google deben enviar solicitudes a nuestros sistemas para que se rastreen.
- El rastreador intentará acceder a las páginas que redirigen a otras. Si tiene "páginas de origen" que redirigen a otras, el rastreador debe acceder a las originales para determinar que hay una redirección. Por lo tanto, las visitas del rastreador a las páginas de origen se mostrarán en los registros de acceso.
- Los sitios se vuelven a rastrear. Por ahora, no podemos controlar la frecuencia con la que nuestros rastreadores indexan el contenido de su sitio. Los robots realizan los rastreos de forma automática. Si se introducen cambios en una página, esos cambios pueden tardar entre una y dos semanas en reflejarse en nuestro índice.