Desde el lanzamiento del crawler Googlebot (a finales del siglo pasado), las peticiones de este bot parecían proceder de una IP asociada (según el registro RIPE) a una geolocalización estadounidense.
La lista de IPs de Googlebot es bien conocida y oficial:
https://developers.google.com/static/search/apis/ipranges/googlebot.json
Recordemos aquí que 5 autoridades regionales (incluida la RIPE NCC para Europa) gestionan la asignación de direcciones IP a los actores de Internet. Y, por cierto, registran la distribución de las direcciones IP por países.
Hasta ahora, todas las IP de Googlebot estaban geolocalizadas en EEUU:
Google ha reservado nuevas IPs fuera de EEUU para rastrear la red
Gary Illyes presentó esta nueva función en una conferencia en Singapur y luego tuvo la oportunidad de comentarla en Twitter.
Por ahora, es sólo una posibilidad. Sin duda, Google ha reservado nuevas IP fuera de EEUU. Aparecen en el archivo JSON oficial.
Googlebot can crawl from a country where the server is located (i.e. from outside US). The system has already gone live but may not be used (at all). In addition, it becomes effective only in a condition where access from outside of the country is blocked. #SearchCentralLive https://t.co/1hPl67NPw8
— Kenichi Suzuki🇺🇦鈴木謙一 (@suzukik) November 24, 2022
El objetivo de este cambio no es rastrear sistemáticamente los sitios web de un país desde IPs geolocalizadas en este país. Se trata de poder rastrear los sitios que bloquean las IP americanas, o presentan contenidos diferentes según la geolocalización del país.