En el ecosistema empresarial actual, el término «data» ha sufrido un proceso de inflación semántica. Se ha convertido en un comodín, una palabra que queda bien en cualquier presentación ejecutiva. Pero antes de hablar de Big Data o Inteligencia Artificial, conviene detenerse en una pregunta básica que casi nadie formula: qué es el dato realmente y por qué entender su origen es tan importante.
Si apartamos todo el ruido mediático y el marketing tecnológico,
¿Qué es el dato en su esencia?
De forma estricta y técnica, el dato no es sabiduría. Ni siquiera es información todavía. Un dato es una representación simbólica de un hecho real. Es el registro digital de que «algo» ha ocurrido en el mundo físico o lógico. Una venta realizada a las 10:03 AM, una llamada de 45 segundos, un clic en un banner o un movimiento de tres palés en el almacén. El dato es el átomo: es objetivo, frío y carente de contexto hasta que lo procesamos.
Sin embargo, en Mets Data vemos constantemente que el mayor problema de las empresas no es la falta de datos. Tienen demasiados. El problema real es que no saben dónde nacen esos datos ni cómo distinguir el original de la copia. Y tomar decisiones estratégicas basadas en una copia alterada es el camino más rápido hacia el fracaso.
Esta distinción entre dato, información y conocimiento ha sido ampliamente analizada en publicaciones como MIT Sloan Management Review, donde se subraya la importancia de comprender el origen del dato antes de construir análisis estratégicos.
El concepto crítico: «Sistema Fuente» (Source System)
Para entender la data, es imperativo entender su origen. Todo dato tiene un lugar de nacimiento, un «kilómetro cero». En consultoría técnica, a esto lo llamamos Sistema Fuente o Source System.
El Sistema Fuente es el punto exacto donde la interacción humana (un empleado tecleando) o mecánica (un sensor midiendo temperatura) se convierte en un registro digital por primera vez. Es el momento en que la realidad pasa a ser un código binario.
¿Por qué es vital entender esto? Porque en el momento en que un dato sale de su sistema fuente, empieza a degradarse. Es como el juego del «teléfono estropeado»: cada vez que un dato se exporta, se copia, se pega o se envía por correo, corre el riesgo de ser manipulado, desactualizado o corrompido. Si no sabes identificar tus sistemas fuente, no puedes confiar en tus informes finales.
A continuación, desglosamos los «lugares de nacimiento» más comunes que probablemente ya existen en tu empresa, para que aprendas a identificarlos y respetarlos:
1. El CRM (Customer Relationship Management)
Es probable que tu equipo comercial viva aquí, pero es importante definir qué es técnicamente.
- Qué es: Es el software diseñado para registrar interacciones. Plataformas como Salesforce, HubSpot o Dynamics. Es la bitácora del viaje del cliente.
- El Dato que genera: Aquí nace la verdad sobre el «cliente» y la «oportunidad».
- El ejemplo práctico: Imagina que un comercial cierra un trato verbalmente. Hasta que no entra en el CRM y marca la oportunidad como «Cerrada/Ganada», ese dato no existe para la empresa. Ese clic es el dato de origen.
- El error común: Es habitual que un Director Comercial lleve su propio Excel paralelo con sus previsiones. Si el CRM dice que se han vendido 100k y el Excel del director dice 120k, la empresa tiene un problema de gobierno del dato. Técnicamente, el CRM debería ser la «fuente de la verdad». Cualquier modificación manual fuera de él es una distorsión de la realidad.
2. El ERP (Enterprise Resource Planning)
Si el CRM es la cara visible hacia el cliente, el ERP es el cerebro y las tripas de la compañía.
- Qué es: El sistema que gestiona la operativa pura: facturación, logística, contabilidad y recursos humanos (ej. SAP, Oracle, NetSuite).
- El Dato que genera: Aquí reside la «verdad financiera» y operativa.
- El ejemplo práctico: El dato de inventario real nace aquí. Cuando un camión descarga mercancía y un operario escanea el albarán, el ERP registra: «Hay 50 unidades». Ese es el dato fuente.
- La discrepancia: A veces, el equipo de Marketing pone en la web (e-commerce) que hay stock porque no han actualizado la web. Si el ERP dice que hay 0 y la web dice que hay 10, el ERP siempre gana. El dato de la web es una copia desactualizada; el dato del ERP es el hecho fáctico. Entender esta jerarquía es vital para evitar vender productos que no tienes.
3. Archivos y SharePoint (Data No Estructurada)
Aquí entramos en terreno peligroso. A menudo se le llama «Shadow IT» (TI en la sombra).
- Qué es: El lugar donde vive el caos operativo: hojas de cálculo (Excel), documentos PDF, Word, correos electrónicos.
- El Dato que genera: Generalmente, datos manuales que no caben en los sistemas anteriores o cálculos «caseros».
- La advertencia crítica: Un archivo de Excel es una herramienta de cálculo maravillosa, pero es un pésimo sistema fuente.
- ¿Por qué? Porque carece de controles de calidad y de auditoría. En un ERP, si intentas borrar una factura emitida, el sistema te lo impide o deja un rastro (huella digital). En un Excel, cualquiera puede borrar una celda por error, guardar el archivo, y ese dato desaparece para siempre sin dejar rastro.
- Si tu empresa basa sus decisiones críticas en un Excel que se envían tres personas por correo cada viernes, no tienes un sistema de datos; tienes un castillo de naipes.
¿Cómo identificar un «Dato de Origen» (Data Source)?
Muchos directivos toman decisiones basándose en un PowerPoint o un PDF muy bonito. Pero ese documento ha pasado por cinco manos, tres departamentos y dos exportaciones antes de llegar a la mesa de dirección.
¿Cómo puedes saber, como no técnico, si estás mirando un dato puro (de origen) o uno procesado (y potencialmente adulterado)? Hazte estas tres preguntas críticas ante cualquier cifra que te presenten:
1. ¿Es el punto de captura inmediato? Busca la inmediatez.
- Ejemplo: El ticket que sale de la caja registradora en una tienda es el dato de origen. El informe de ventas semanal que hace el gerente de tienda es un dato agregado. Si hay discrepancia entre la suma de los tickets y el informe del gerente, los tickets tienen la razón. El dato de origen es la evidencia forense; el informe es solo una interpretación.
2. ¿Es mutable o inmutable? Esta es la prueba del algodón.
- Los datos de origen en sistemas robustos suelen ser registros históricos inmutables. Una vez que se emite una factura con el número 001, no se puede «des-emitir», se tiene que hacer una factura rectificativa. Queda rastro.
- Si el dato que estás mirando está en un formato donde alguien puede cambiar un «5» por un «8» y darle a guardar sin que nadie se entere (como en una hoja de cálculo), duda de su veracidad. Los datos volátiles rara vez son la fuente real.
3. ¿Quién es el dueño nominal? Un dato de origen siempre tiene un «padre» o un responsable claro dentro de la organización.
- El Director de Ventas es el dueño de los datos del CRM. El Director Financiero es el dueño de los datos del ERP.
- Pero, ¿quién es el dueño de los datos de un PowerPoint de resumen trimestral? Nadie lo sabe con certeza. Cuando un dato no tiene dueño, pierde su fiabilidad. Si nadie es responsable de su calidad, asume que el dato es de mala calidad.

Conclusión: El respeto por la materia prima
Entender la diferencia entre la fuente (el manantial) y el reporte (el agua embotellada) es el primer paso indispensable para una estrategia de datos sólida.
Antes de invertir en algoritmos predictivos complejos o en herramientas de visualización de última generación, asegúrate de que sabes identificar y proteger tus sistemas fuente. Porque la analítica más avanzada del mundo no servirá de nada si se alimenta de datos que nacieron en un Excel corrupto y no en la realidad de tu negocio.
Hablemos
En 30 minutos podemos entender si estamos alineados y si podemos ayudarte.
👉 CONTACTO