ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

Image description

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

7 de cada 10 profesionales del sector IT en España planea cambiar de empresa en el próximo año

Según el informe Tech Talent Explorer de Hays, líder global en selección y soluciones de recursos humano, un 69 % de los profesionales del sector IT en España prevé cambiar de empresa en los próximos doce meses, cifra que supera la media global del 61 %. Este elevado nivel de movilidad revela un mercado tecnológico español altamente dinámico y competitivo, en el que las empresas deben urgentemente revisar sus estrategias para fidelizar talento.

El alquiler de habitaciones, ¿una forma moderna de infravivienda?

“Lo que estamos viendo en nuestras ciudades es la proliferación del alquiler de habitaciones, que es una forma moderna de infravivienda”. Con esta advertencia, Joan Clos, presidente de FIABCI España, junto a Felice Tufano, vicepresidente, y Eva González-Nebreda, secretaria general, inauguraron la 22ª edición de Inmointer, ‘Encuentro del Mercado Inmobiliario Internacional’, celebrada en el API Center de Barcelona y organizada por FIABCI España.

ZTE lanza en España la baliza conectada V16 ZTE E1, certificada por la DGT para reforzar la seguridad vial

ZTE, proveedor internacional de telecomunicaciones y soluciones inteligentes de conectividad, anuncia el lanzamiento en España de su nueva baliza conectada V16, ZTE E1, un dispositivo obligatorio a para los conductores españoles que marca un antes y un después en la seguridad vial. A partir del 1 de enero de 2026, este tipo de dispositivos sustituirá de forma definitiva a los triángulos de emergencia, tal y como establece la Dirección General de Tráfico (DGT).

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.