Saltar al contenido
Todos los posts
15 de febrero de 2024·3 min de lectura·Diogo Hudson

La importación con IA cambió cómo cotizamos

Los proveedores te mandan PDF, Excel, CSV — nunca en el formato que tu sistema quiere. La importación con IA resuelve ese puente.

La importación con IA cambió cómo cotizamos

Todo distribuidor conoce el ritual: abrir el PDF del proveedor, cambiar a la hoja de cálculo, empezar a transcribir. Línea por línea. Durante años la regla fue que el ingreso de cotizaciones se come media tarde de un vendedor. No tiene que ser así.

El Bureau of Labor Statistics de EE.UU. registra que el comercio mayorista por sí solo emplea a más de 6 millones de personas. Una buena parte de esas horas se gasta en reingreso de datos — leyendo el documento del proveedor en una pantalla y tecleándolo en otra. Eso no es trabajo especializado. No es trabajo de criterio. Es copiar y pegar a velocidad humana, y es el mayor cuello de botella en el pipeline de ventas del distribuidor.

Qué hace realmente la IA El importador de Quotery normaliza el documento fuente (PDF, XLSX, XLS o CSV) en texto estructurado, luego le pide a gpt-4.1-mini que extraiga ítems de línea, grupos y precios en un schema JSON estricto. Sin parseo de texto libre — el modelo devuelve un payload que coincide exactamente con lo que el importador espera. Un objeto QuoteSection envuelve ítems QuoteLine, cada uno con código de producto, descripción, unidad, cantidad, precio unitario y campos de descuento. El modelo nunca ve tu catálogo, nunca toca tus niveles de inventario, y nunca interactúa con los datos de tu tenant. Solo ve el documento que subiste.

El input que llega al modelo es texto normalizado — primero extraemos los formatos binarios propietarios. Para PDFs, eso significa extraer streams de texto página por página usando pypdf. Para Excel, lectura de celdas fila por fila produciendo una representación tabular en texto. Para CSVs, validación de la estructura de columnas. Solo la representación en texto sale del perímetro de tu tenant.

Determinístico primero, IA después Con las líneas candidatas, comparamos los códigos de producto deterministicamente contra las cuatro columnas de código del catálogo: SKU, import_code, internal_code y export_code. Un match exacto de string en cualquier columna es un acierto. Solo las líneas sin match exacto van a gpt-4.1-mini, junto con una lista corta de candidatos de tu catálogo. El modelo elige uno o los rechaza todos.

El match determinístico de código es gratuito, instantáneo y nunca se equivoca. El paso de IA cuesta latencia y tokens, así que solo lo pagamos cuando es necesario. En la práctica, cerca del 60-70% de las líneas se resuelven deterministicamente — la IA se encarga del resto, más las líneas donde la descripción del proveedor no coincide con tus convenciones internas de nomenclatura.

Tres clasificaciones, cero scores de confianza Cada línea importada cae con una de tres etiquetas: coincidencia exacta, decisión de IA o no encontrado. No hay porcentajes de confianza, no hay cajas de 'quizás', no hay umbrales difusos que calibrar. El método es la etiqueta. Si ves 'coincidencia exacta', un código alineó. Si ves 'decisión de IA', el modelo eligió de tu catálogo. Si ves 'no encontrado', necesitas agregar un producto o corregir un código de proveedor.

Este sistema de clasificación significa que la experiencia de revisión es un triaje, no una maratón de validación. Escaneas las líneas 'no encontrado' y las resuelves. Todo lo demás está listo para ponerle precio. Una retranscripción de 30 minutos se vuelve una revisión de 60 segundos.

Por qué esto supera al OCR Los pipelines de OCR tradicionales extraen texto de imágenes y luego aplican patrones de regex. Se rompen con PDFs de múltiples columnas, tablas rotadas, celdas combinadas, y documentos de proveedor que cambian de layout cada mes. Nuestro enfoque se salta completamente el parseo de layout — le entregamos el texto crudo a un modelo que entiende estructura, no píxeles. El mismo pipeline procesa una hoja de Excel limpia y un PDF desordenado de proveedor sin configuración por proveedor.

Para más detalles sobre cómo leemos PDFs (y por qué rechazamos archivos escaneados solo de imagen), consulta nuestro post sobre los internals de la extracción de PDF.

Ve cómo la IA convierte documentos de proveedor en cotizaciones en menos de un minuto.

Todos los posts
Textos cortos sobre cotizar, inventario, IA y cómo los distribuidores pequeños despachan mucho volumen sin tanto rodeo.