Seina Usuario habitual

 Mensajes: 91 Desde: 11/Dic/2004 | posible rastreo erróneo de robots
Algo extraño están haciendo desde hace unos días (¿10?) los robots de búsqueda Google cuando rastrean blogcindario: a) un ejemplo Hago esta búsqueda (corresponde a un artículo reciente publicado): SEARCH=> Julio César Irala Mena es un niño prodigio de 11 años
El 2º RESULTADO que sale es: Buscando: titico69 - Blogcindario.com A los 11 años ya dicta conferencias y quiere ingresar a la universidad de Paraguay Julio César Irala Mena es un niño prodigio de 11 años que ya quiere ... blogcindario.miarroba.com/search/?q=titico69 - 38k - En caché - Páginas similares
b) Da impresión de que rastrea otras páginas en vez de las actualizadas en los blogs, como si se fuese por otras direcciones. De hecho han desaparecido de Google cantidad de búsquedas sobre BLOGS DE BLOGCINDARIO que en días pasados salían bien posicionadas
c) Me llama la atención que en esta búsqueda SEARCH=> site:blogcindario.miarroba.com/search/?q se obtengan aproximadamente 301,000 RESULTADOS, mayoría irrelevantes, según el caché
|
31/Mar/2008 12:23 GMT+1 | Perfil · Privado · Desconectado · Web |
Seina Usuario habitual

 Mensajes: 91 Desde: 11/Dic/2004 | RE: posible rastreo erróneo de robots
Escrito originalmente por Seina Algo extraño están haciendo desde hace unos días (¿10?) los robots de búsqueda Google cuando rastrean blogcindario...
POR SI SIRVE Este consejo "me supera":Cita
Cómo verificar Googlebot Para asegurarse de que un robot que accede a su servidor realmente es Googlebot, puede realizar una búsqueda DNS invertida, comprobando que el nombre se encuentra en el dominio googlebot.com, y realizando posteriormente una búsqueda DNS de reenvío y utilizando ese nombre de googlebot. Esto es muy útil si le preocupa que los emisores de spam u otros malhechores puedan acceder a su sitio haciéndose pasar por Googlebot. Por ejemplo, > host 66.249.66.1 puntero de nombre de dominio 1.66.249.66.in-addr.arpa crawl-66-249-66-1.googlebot.com. > host crawl-66-249-66-1.googlebot.com crawl-66-249-66-1.googlebot.com tiene la dirección 66.249.66.1
Google no publica una lista de direcciones IP para que los webmasters las incluyan en listas blancas. Esto se debe a que los intervalos de estas direcciones IP pueden variar, lo que provoca problemas para cualquier webmaster que los haya integrado.
|
31/Mar/2008 12:25 GMT+1 | Perfil · Privado · Desconectado · Web |
Tito Administrador del foro


Usuario PRO Mensajes: 1.317 Desde: 08/Mar/2002 | RE: posible rastreo erróneo de robots
La pagina central de blogcindario es escaneada por google de forma mas frecuente que cualquier blog del servicio, de ahi que ya esta en google mientras que tu articulo no... ten en cuenta que lo has publicado ayer.. no has dado tiempo suficiente como para que google te visite.
"Quien mucho abarca, poco aprieta"
"Quien siembra vientos, recoge tempestades" |
31/Mar/2008 13:00 GMT+1 | Perfil · Privado · Desconectado · Web · Fotolog |
Seina Usuario habitual

 Mensajes: 91 Desde: 11/Dic/2004 | RE: posible rastreo erróneo de robots
Escrito originalmente por Tito ...no has dado tiempo suficiente como para que google te visite.
No me refiero al tiempo sino al contenido que procesa.
En el ejemplo que te he puesto el CACHÉ es del 30 Mar 2008 08:15:23 GMT. Pero el contenido que guarda nada tiene que ver con Buscando: titico69 - Blogcindario.com que vete a saber de cuándo es... y en él se ha colado parte del texto que publiqué ese mismo día
Seguramente, al titico69 ese, cuando hizo su búsqueda ni le apareció por asomo mi página...
|
01/Abr/2008 12:45 GMT+1 | Perfil · Privado · Desconectado · Web |
Tito Administrador del foro


Usuario PRO Mensajes: 1.317 Desde: 08/Mar/2002 | RE: posible rastreo erróneo de robots
Si te fijas, esa búsqueda no obtiene resultados, informa de ello y a continuación muestra los últimos artículos publicados en blogcindario... de ahí que dio la casualidad que cuando google nos visito, tu articulo era uno de los últimos publicados.
"Quien mucho abarca, poco aprieta"
"Quien siembra vientos, recoge tempestades" |
01/Abr/2008 12:56 GMT+1 | Perfil · Privado · Desconectado · Web · Fotolog |