ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Así utilizarán la inteligencia artificial las marcas de moda en 2026

La inteligencia artificial ha pasado en pocos años de ser un experimento en laboratorios de innovación a convertirse en una de las grandes palancas de crecimiento del sector moda. Se prevé que la IA generativa será prioritaria para la mayoría de los directivos del sector y que las marcas que la integren de forma estratégica serán las que ganen en eficiencia, crecimiento y fidelización.

“Your Friends Are Boring” se alza como ganadora en el foro de inversión del Seed Startup Program

“Your Friends Are Boring” se ha alzado como ganadora del Seed Startup Program, impulsado por València Innovation Capital y Startup Valencia. La startup valenciana, fundada por Clara Haba y Amaury de Castelnau, organiza viajes grupales que conectan a personas con intereses afines a través de experiencias compartidas. Su enfoque creativo, el modelo de negocio que reinventa el turismo experiencial con impacto social y los hitos alcanzados desde su MVP y sus primeros viajes le han permitido destacar entre las más de 28 participantes de esta edición.