ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

7 de cada 10 españoles viajará esta Semana Santa y casi la mitad recurrirá a sus ahorros para pagar sus escapadas (que costarán de media 598 euros)

Las vacaciones de Semana Santa se consolidan como uno de los principales periodos de viaje para los españoles, pues aprovechan estos días para realizar escapadas y desconectar antes de la temporada estival. Tal es así que 7 de cada 10 españoles (70,1 %) tienen previsto viajar durante estas fiestas, frente a un 3,9 % que afirma que no podrá hacerlo por no disponer de vacaciones. 

Trump nombra a los CEO de Nvidia y Meta entre los consejeros sobre ciencia y tecnología de la Casa Blanca

El presidente de Estados Unidos, Donald Trump, ha nombrado a los primeros 13 miembros de su Consejo Presidencial de Asesores en Ciencia y Tecnología (PCAST), entre los que figuran el consejero delegado de Nvidia, Jensen Huang, y el de Meta Platforms, Mark Zuckerberg, que brindarán recomendaciones sobre cómo reforzar el liderazgo estadounidense en ciencia y tecnología, incluyendo la inteligencia artificial.

Los mayores de 55 años se consolidan como motor económico y social, y concentran cerca del 40% del consumo privado

El envejecimiento de la población está transformando de forma profunda la economía y la sociedad. En España, la población mayor de 55 años tiene cada vez mayor peso demográfico, económico y social, y se consolida como uno de los motores de consumo, ahorro e inversión del país. Actualmente, representan el 34% de la población española, más de 16,7 millones, y su consumo privado medio supera al del conjunto de la población.