ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

Viviendas y alojamientos turísticos en tiempo récord: la solución modular de ROOM2030 para el boom del norte de España

Ante los desafíos del mercado inmobiliario derivados de la creciente presión residencial y turística en el norte peninsular, acentuada por el encarecimiento del Mediterráneo, el modelo constructivo tradicional muestra claras limitaciones, frente a las que ROOM2030 ofrece soluciones modulares sostenibles, de rápida ejecución, con precio cerrado y adaptadas a las nuevas formas de habitar.

El sector audiovisual catalán crece un 6% y supera por primera vez los 9.000 millones de euros de volumen de negocio

Según un estudio elaborado por ACCIÓ (Empresa y Trabajo) con motivo de la celebración del Integrated Systems Europe (ISE) la próxima semana apunta que este sector equivale al 3% del PIB de Cataluña. La presentación del estudio ha servido también para destacar la presencia de empresas catalanas en la feria, con un stand de Empresa y Trabajo y uno del Departamento de Cultura que promociona la creatividad digital del país.

Alibaba aporta a las compañías españolas más de 2.500 millones en ventas en China entre 2022 y 2024

El gigante chino del comercio electrónico Alibaba ha aportado a las empresas españolas más de 2.500 millones de euros en ventas en China entre los años 2022 y 2024, según el informe de impacto económico 'La contribución de los marketplaces digitales de Alibaba a la economía europea y al desarrollo internacional sostenible de las pymes' elaborado por la SDA Bocconi School of Management.

CaixaBank obtiene un beneficio neto de 5.891 millones de euros en 2025, un 1,8% más, por el fuerte crecimiento del negocio

El consejero delegado de la entidad, Gonzalo Gortázar, ha afirmado que “2025 ha sido un gran año para CaixaBank, en el que hemos superado los objetivos que nos habíamos marcado al inicio del ejercicio, con mayor crecimiento del negocio y una solidez financiera aún más robusta. Como consecuencia, hemos revisado al alza los objetivos de crecimiento y rentabilidad que habíamos fijado en nuestro Plan Estratégico”.  

El 44% de los propietarios dejaría de alquilar su piso ante cambios legislativos que reduzcan la seguridad jurídica o la rentabilidad

Propietarios advierten que el problema no es la especulación sino la inseguridad jurídica (8 de cada 10 propietarios son de mediana o tercera edad).  El 64% cree que una mayor seguridad incentivaría la oferta de alquileres, aunque la escalada de precios se explica también por la relación entre oferta y demanda, la nueva legislación, la inflación y el auge de los pisos turísticos.

Fujitsu lanza una nueva plataforma que permite la operación autónoma de la inteligencia artificial generativa, optimizada para aplicaciones internas en un entorno dedicado

Fujitsu anuncia el lanzamiento de una plataforma de IA dedicada que permite a las empresas gestionar de forma autónoma todo el ciclo de vida de la inteligencia artificial generativa, incluyendo el desarrollo óptimo de modelos, su operación y el aprendizaje incremental, así como la mejora continua de modelos y agentes. La plataforma se desplegará de forma progresiva en Japón y Europa, y está previsto que el registro para pruebas preliminares comience en febrero de 2026.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.