ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

Image description

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

Irse a vivir de alquiler hoy supone destinar más del 35% de los ingresos familiares (y Baleares, madrileños y catalanes registran la mayor tasa de esfuerzo para cumplir con el alquiler)

En España, alrededor del 18% de las familias actualmente vive de alquiler. Sin embargo, quienes decidan optar por esta modalidad habitacional hoy se enfrentan a un panorama complicado: en las condiciones actuales del mercado inmobiliario, el alquiler representa más del 35% de los ingresos netos familiares, según un análisis de la consultora AIS, parte del grupo PFSTECH y especialista en big data y analytics. 

Las empresas catalanas han recibido más de 1.500 millones de euros de los fondos Next Generation desde 2021

El consejero de Empresa y Trabajo, Miquel Sàmper, ha anunciado hoy que "las empresas catalanas han captado 1.540millones de euros desde 2021 en el conjunto de convocatorias competitivas de alcance estatal de los fondos Next Generation" , destacando ámbitos sectoriales como la movilidad sostenible (30%) o los proyectos de I+D (29%). Sàmper ha hecho público el balance de captación de los tres años de estos fondos europeos, durante la inauguración del tercer Congreso de la Asociación TECNIO en Terrassa.

IMPT y Gimmonix forman una alianza estratégica para transformar la industria de los viajes hacia la sostenibilidad

IMPT, la plataforma pionera en viajes sostenibles, anuncia una nueva alianza estratégica con Gimmonix, empresa tecnológica que ofrece soluciones innovadoras a las compañías de viajes para optimizar sus operaciones. Este acuerdo marca un hito significativo en la misión de IMPT de convertirse en el líder global en viajes conscientes con el carbono, ofreciendo una alternativa innovadora en un mercado dominado por grandes jugadores como Booking Holdings y Expedia Group.

De los jamones a los productos personalizados: la evolución del regalo navideño corporativo

Dar un obsequio corporativo se ha convertido en una de las prácticas más comunes entre las empresas españolas, especialmente durante épocas festivas como la Navidad, como una manera de reconocer y agradecer el esfuerzo y la dedicación del equipo, la confianza de los clientes o el servicio de los proveedores más habituales. Sin embargo, los regalos de empresa han cambiado con el tiempo, y donde antes el jamón era la estrella; ahora la personalización de los regalos y la tecnología ganan cada vez más terreno. Con la época navideña a la vuelta de la esquina, MediaMarkt Business, división de MediaMarkt especializada en soluciones para empresas, resalta la importancia de la antelación y personalización en los regalos corporativos, como estrategia de fidelización y reconocimiento de marca.

IMPT y Desigual marcan un hito en la moda sostenible con una innovadora alianza en e-commerce ecológico

La nueva era del e-commerce consciente ha llegado para quedarse. Desigual, una de las marcas de moda más icónicas y creativas del panorama internacional, ha dado un paso decisivo hacia la sostenibilidad al incorporarse a IMPT, la plataforma líder en soluciones para compensar la huella de carbono. Esta colaboración representa un avance significativo en la creación de un comercio electrónico más responsable, donde los consumidores pueden seguir disfrutando de la moda única de Desigual mientras contribuyen activamente a la protección del medio ambiente.

La inteligencia artificial avanza a pasos agigantados: 1 de cada 3 empleados en Cataluña ya la utiliza diariamente

Este mes se cumplen exactamente dos años desde el lanzamiento de ChatGPT (30 de noviembre de 2022), un modelo de lenguaje avanzado que marcó el inicio de la democratización en el uso de la inteligencia artificial por parte de la ciudadanía, pero también de las empresas, que han visto en ella la oportunidad perfecta de generar disrupción en toda su cadena de valor. Desde entonces, la IA no solo ha demostrado su capacidad para revolucionar diversos sectores, sino que también ha ganado protagonismo como una herramienta clave en el ámbito laboral y, en concreto, en dos vertientes claras: en el empleo en sí y en el desempeño diario de los trabajadores (es decir, en las formas de trabajar).

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.