ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

Image description

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

Barcelona, Madrid, Málaga y Alicante serán las autonomías más castigadas por la suspensión de la 'golden visa'

El Gobierno anunció hace unas semanas la limitación de la compra de viviendas por parte de extranjeros extracomunitarios no residentes mediante el incremento hasta el 100% del gravamen fiscal que deben pagar los no europeos que no residen en España cuando compran una vivienda. Además, la suspensión definitiva de las 'golden visa' se producirá este próximo mes de abril , cuando las autoridades españolas dejarán de aceptar solicitudes de visados para inversores que adquieran una propiedad inmobiliaria de más de medio millón de euros.

El Puerto de Barcelona construirá tres nuevos puntos de atraque destinados principalmente a combustibles verdes por un importe de 124 millones de euros

El Consejo de Administración del Puerto de Barcelona dio hoy luz verde al inicio del expediente para construir tres nuevos puntos de atraque para líquidos a granel en la cara este del muelle de la Energía, similares al actual atracador 34B. Estas instalaciones se destinarán principalmente a la carga y descarga de los nuevos combustibles sostenibles que deben permitir la descarbonización del transporte y la logística. La inversión prevista es de 124 millones de euros.

Empleados de AstraZeneca reforestan bosques en Sant Martí de Tous, Barcelona

AstraZeneca y Bosquea han celebrado la jornada de voluntariado 'hAZiendo horizonte juntos', en la que ha reunido un medio centenario de trabajadores de la compañía farmacéutica para contribuir a la regeneración de bosques en Sant Martí de Tous, Barcelona. Esta actividad marca un paso crucial en su proyecto de plantación de especies autóctonas en la zona, con el que esperan alcanzar un total de 2.200 árboles y compensar 190 toneladas de CO 2 a lo largo de los próximos 50 años.

El stand de Cataluña en la feria internacional B-Travel 2025 gira en torno a la distinción como Región Mundial de la Gastronomía 2025

El stand de Cataluña en la feria internacional B-Travel 2025 gira en torno a la distinción de nuestro país como Región Mundial de la Gastronomía 2025. La directora general de Turismo, Cristina Lagé, ha inaugurado hoy este salón de experiencias turísticas que tiene lugar hasta el domingo 30 de marzo en el recinto Montjuïc de Fira de Barcelona. En su inauguración le han acompañado el director general de Turespaña, Miguel Ángel Sanz; el director general de Fira de Barcelona, ​​Constantí Serrallonga; el presidente de B-Travel, Martí Sarrate; la directora del salón, Marta Serra; y la directora de la Agencia Catalana de Turismo, Arantxa Calvera.

TRC abre nueva filial en Cataluña para impulsar la ciberseguridad y defensa poniendo al frente a Diego Presa

TRC, empresa líder en ciberseguridad con capital 100% nacional, anuncia la inversión en Cataluña con la apertura de TRC CAT. El principal objetivo es fortalecer la presencia y ofrecer soluciones avanzadas en el ámbito de la seguridad, fronteras inteligentes, ciberdefensa y transformación digital a las Administraciones Públicas y empresas privadas. TRC réplica así el exitoso modelo de cercanía iniciado en el País Vasco con TRC Bat.

Actiu destina más de 7,5 millones de euros, en los últimos 3 años, a su estrategia de sostenibilidad e I+D+i, incluyendo la optimización de procesos, reducción de emisiones y certificaciones clave

Actiu se posiciona a la vanguardia de la transformación sostenible del sector del mobiliario, combinando certificaciones de referencia con un enfoque innovador en la gestión de emisiones. Para ello, la multinacional española, especializada en mobiliario para espacios de trabajo, ha destinado 7.533.831 euros a una estrategia integral de I+D, sostenibilidad y digitalización, que abarca desde la optimización de procesos productivos hasta la implementación de certificaciones que fortalecen su competitividad en un mercado en transformación. Actiu ha logrado un incremento de alrededor del 30% de inversión en estas áreas cada año.

Sopra Steria Next presenta su estudio “Generative AI: from Exploration to Impact”

Arriba Steria Next, la división de consultoría del Grupo Sopra Steria , reconocido líder europeo en consultoría, servicios digitales y desarrollo de software, ha publicado la segunda edición de su estudio sobre el mercado mundial de la IA generativa. El estudio ' IA generativa - Desde Exploración a Impacto ' explora la dinámica del mercado de la inteligencia artificial generativa, los retos que se presentan y las oportunidades para maximizar su valor. 

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.