ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

La Agencia Catalana del Consumo y los Gremios de Comercio, Servicios y Turismo cooperarán para consolidar la confianza en el comercio de proximidad

El director de la Agencia Catalana del Consumo (Departamento de Empresa y Trabajo), Isidor Garcia Sanchez, y el presidente del Consejo de Gremios de Comercio, Servicios y Turismo, Joan Manel Guillén Espín, han firmado un convenio de colaboración entre ambos organismos, con el fin de acompañar a las empresas en procesos de mejora de la calidad y la atención a las personas consumidoras.

Así utilizarán la inteligencia artificial las marcas de moda en 2026

La inteligencia artificial ha pasado en pocos años de ser un experimento en laboratorios de innovación a convertirse en una de las grandes palancas de crecimiento del sector moda. Se prevé que la IA generativa será prioritaria para la mayoría de los directivos del sector y que las marcas que la integren de forma estratégica serán las que ganen en eficiencia, crecimiento y fidelización.

“Your Friends Are Boring” se alza como ganadora en el foro de inversión del Seed Startup Program

“Your Friends Are Boring” se ha alzado como ganadora del Seed Startup Program, impulsado por València Innovation Capital y Startup Valencia. La startup valenciana, fundada por Clara Haba y Amaury de Castelnau, organiza viajes grupales que conectan a personas con intereses afines a través de experiencias compartidas. Su enfoque creativo, el modelo de negocio que reinventa el turismo experiencial con impacto social y los hitos alcanzados desde su MVP y sus primeros viajes le han permitido destacar entre las más de 28 participantes de esta edición.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.