ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

7 de cada 10 profesionales del sector IT en España planea cambiar de empresa en el próximo año

Según el informe Tech Talent Explorer de Hays, líder global en selección y soluciones de recursos humano, un 69 % de los profesionales del sector IT en España prevé cambiar de empresa en los próximos doce meses, cifra que supera la media global del 61 %. Este elevado nivel de movilidad revela un mercado tecnológico español altamente dinámico y competitivo, en el que las empresas deben urgentemente revisar sus estrategias para fidelizar talento.

El alquiler de habitaciones, ¿una forma moderna de infravivienda?

“Lo que estamos viendo en nuestras ciudades es la proliferación del alquiler de habitaciones, que es una forma moderna de infravivienda”. Con esta advertencia, Joan Clos, presidente de FIABCI España, junto a Felice Tufano, vicepresidente, y Eva González-Nebreda, secretaria general, inauguraron la 22ª edición de Inmointer, ‘Encuentro del Mercado Inmobiliario Internacional’, celebrada en el API Center de Barcelona y organizada por FIABCI España.

Nace la empresa española InferX para monetizar y acelerar la Inteligencia Artificial

InferX, una nueva empresa independiente nacida tras una década de liderazgo de Submer en gestión térmica y experiencia en centros de datos sostenibles, se ha lanzado oficialmente con la misión de acelerar la era de la inteligencia: la siguiente fase de la cuarta revolución industrial, en la que la inteligencia misma se convierte en el motor del progreso económico e industrial. InferX ofrece la infraestructura y los servicios que permiten la monetización de la IA a escala, redefiniendo la construcción, entrega y valor de la inteligencia.

La empresa estadounidense Elian invertirá más de 200 millones de euros para ampliar su planta de proteína vegetal en el Port de Barcelona

La empresa Elian Barcelona, ​​filial de la estadounidense Viserion, invertirá más de 200 millones de euros para ampliar su planta de proteína vegetal en el Port de Barcelona. En una presentación pública en las instalaciones portuarias este jueves con la presencia del secretario de Empresa y Competitividad y consejero delegado de ACCIÓ, Jaume Baró Torres, Elian ha presentado la segunda fase de su proyecto industrial, que permitirá a la empresa ampliar su capacidad productiva en más de 100.000 toneladas anuales para superar las 830.000 toneladas anuales.