Los chatbots de inteligencia artificial, como ChatGPT y Gemini, enfrentan dificultades al procesar archivos PDF, lo que resulta en extraer información de manera inexacta. Los usuarios a menudo esperan resúmenes rápidos o datos específicos, pero los resultados pueden ser confusos debido a la estructura no lineal de estos documentos.
Un PDF no sigue el mismo orden lógico que una página web, ya que el texto se almacena en fragmentos independientes con coordenadas específicas. Esto provoca que la información extraída no coincida con la forma en que se presenta al leerlo. La falta de relaciones explícitas entre frases puede dificultar que los sistemas deduzcan correctamente el contenido, especialmente en documentos con múltiples columnas o elementos superpuestos.
Este desafío resalta la necesidad de una nueva aproximación en el procesamiento de documentos, ya que los sistemas, a pesar de sus avances en otras áreas como matemáticas y programación, aún no logran manejar con eficacia la complejidad de los PDFs.