Nuevo usuario
·

publicidad

posible rastreo erróneo de robots
  · Índice de subforos · Blogs bugs

Buscar · Tags · Tagboard · Usuarios · Fisgona · F.A.Q.

Autor Mensaje 
SeinaSeina
Usuario habitual
Usuario habitual

Haz clic para ver el perfil del usuario
Mensajes: 91
Desde: 11/Dic/2004
posible rastreo erróneo de robots

Algo extraño están haciendo desde hace unos días (¿10?) los robots de búsqueda Google cuando rastrean blogcindario:

a) un ejemplo
Hago esta búsqueda (corresponde a un artículo reciente publicado):
SEARCH=> Julio César Irala Mena es un niño prodigio de 11 años

El 2º RESULTADO que  sale es:
Buscando: titico69 - Blogcindario.com
A los 11 años ya dicta conferencias y quiere ingresar a la universidad de Paraguay Julio César Irala Mena es un niño prodigio de 11 años que ya quiere ...
blogcindario.miarroba.com/search/?q=titico69 - 38k -  En caché - Páginas similares


b) Da impresión de que rastrea otras páginas en vez de las actualizadas en los blogs, como si se fuese por otras direcciones. De hecho han desaparecido de Google cantidad de búsquedas sobre BLOGS DE BLOGCINDARIO que en días pasados salían bien posicionadas

c) Me llama la atención que en esta búsqueda  SEARCH=> site:blogcindario.miarroba.com/search/?q
se obtengan  aproximadamente 301,000 RESULTADOS, mayoría irrelevantes, según el caché
31/Mar/2008 12:23 GMT+1 Perfil ·  Privado · Desconectado ·  Web
SeinaSeina
Usuario habitual
Usuario habitual

Haz clic para ver el perfil del usuario
Mensajes: 91
Desde: 11/Dic/2004
RE: posible rastreo erróneo de robots

Escrito originalmente por Seina

Algo extraño están haciendo desde hace unos días (¿10?) los robots de búsqueda Google cuando rastrean blogcindario...



POR SI SIRVE
Este consejo "me supera":
Cita

Cómo verificar Googlebot
 
 Para asegurarse de que un robot que accede a su servidor realmente es Googlebot, puede realizar una búsqueda DNS invertida, comprobando que el nombre se encuentra en el dominio googlebot.com, y realizando posteriormente una búsqueda DNS de reenvío y utilizando ese nombre de googlebot. Esto es muy útil si le preocupa que los emisores de spam u otros malhechores puedan acceder a su sitio haciéndose pasar por Googlebot.
 
 Por ejemplo,
 > host 66.249.66.1
  puntero de nombre de dominio 1.66.249.66.in-addr.arpa
  crawl-66-249-66-1.googlebot.com.
 
 > host crawl-66-249-66-1.googlebot.com
  crawl-66-249-66-1.googlebot.com tiene la dirección 66.249.66.1
 

 Google no publica una lista de direcciones IP para que los webmasters las incluyan en listas blancas. Esto se debe a que los intervalos de estas direcciones IP pueden variar, lo que provoca problemas para cualquier webmaster que los haya integrado.

 
31/Mar/2008 12:25 GMT+1 Perfil ·  Privado · Desconectado ·  Web
TitoTito
Administrador del foro
Administrador del foro

Haz clic para ver el perfil del usuario

Usuario PRO Usuario PRO
Mensajes: 1.317
Desde: 08/Mar/2002
RE: posible rastreo erróneo de robots

La pagina central de blogcindario es escaneada por google de forma mas frecuente que cualquier blog del servicio, de ahi que ya esta en google mientras que tu articulo no... ten en cuenta que lo has publicado ayer.. no has dado tiempo suficiente como para que google te visite.

"Quien mucho abarca, poco aprieta"
"Quien siembra vientos, recoge tempestades"
31/Mar/2008 13:00 GMT+1 Perfil ·  Privado · Desconectado ·  Web ·  Fotolog
SeinaSeina
Usuario habitual
Usuario habitual

Haz clic para ver el perfil del usuario
Mensajes: 91
Desde: 11/Dic/2004
RE: posible rastreo erróneo de robots

Escrito originalmente por Tito
...no has dado tiempo suficiente como para que google te visite.

No me refiero al tiempo sino al contenido que procesa.

En el ejemplo que te he puesto el CACHÉ es del 30 Mar 2008 08:15:23 GMT.
Pero el contenido que guarda nada tiene que ver con
Buscando: titico69 - Blogcindario.com
que vete a saber de cuándo es... y en él se ha colado parte del texto que publiqué ese mismo día

Seguramente, al titico69 ese,  cuando hizo su búsqueda ni le apareció por asomo mi página...



01/Abr/2008 12:45 GMT+1 Perfil ·  Privado · Desconectado ·  Web
TitoTito
Administrador del foro
Administrador del foro

Haz clic para ver el perfil del usuario

Usuario PRO Usuario PRO
Mensajes: 1.317
Desde: 08/Mar/2002
RE: posible rastreo erróneo de robots

Si te fijas, esa búsqueda no obtiene resultados, informa de ello y a continuación muestra los últimos artículos publicados en blogcindario... de ahí que dio la casualidad que cuando google nos visito, tu articulo era uno de los últimos publicados.

"Quien mucho abarca, poco aprieta"
"Quien siembra vientos, recoge tempestades"
01/Abr/2008 12:56 GMT+1 Perfil ·  Privado · Desconectado ·  Web ·  Fotolog
· Índice de subforos · Blogs bugs

Temas similares Autor#VisitasÚltimo post
archivo robots.txt26/Mar/2008, 12:51
SeinaSeina
 3 24826/Mar/2008, 19:48
LiMLiM Ir al último mensaje del tema
REPORTANDO PROBLEMA DE POSIBLE BUG04/Abr/2008, 08:14
chichicastechichicaste
 4 18423/Abr/2008, 20:58
chichicastechichicaste Ir al último mensaje del tema

Opciones:

Versión imprimible del tema
Subscríbete a este tema
Date de baja de este tema
Menear este tema en meneame.net
Ir al subforo:  

TU NO PUEDES Escribir nuevos temas en este foro
TU NO PUEDES Responder a los temas en este foro
TU NO PUEDES Editar tus propios mensajes en este foro
TU NO PUEDES Borrar tus propios mensajes en este foro

Todas las fechas y horas son GMT+1. Ahora son las 09:22
 

©2001-08 Miarroba Networks, S.L.
Todos los derechos reservados

    Añadir a Favoritos     Establecer como página de inicio     Contacte con nosotros   Alojamiento web en Ferca Network
Miarroba Networks, S.L. Apartado de correos, 50, 39610 Astillero (CANTABRIA) - CIF B-39512736
Inscrita en el Registro Mercantil de Cantabria, tomo 743, folio 161, libro 0, hoja S-12428, Instripción 1ª
publicidad