Integridad de los datos o calidad ¿Cuál es la diferencia?
Integridad de los datos o calidad ¿Cuál es la diferencia?

Integridad de los datos o calidad ¿Cuál es la diferencia?

Big Data ha sido ampliamente etiquetado como el nuevo oro negro, sin embargo, Big Data se convierte en un producto realmente valioso solo cuando los datos son de alta calidad determinados en función de un rango de variables cualitativas y cuantitativas. En este post exploramos las diferencias entre la calidad de los datos y la integridad de los datos:

Calidad de los datos frente a la integridad de los datos

La calidad de los datos se refiere a las características que determinan la confiabilidad de la información para cumplir un fin previsto, incluida la planificación, la toma de decisiones y las operaciones.

Es el estado de características, además de atributos completos que definen la usabilidad de la información, para abordar necesidades específicas en el contexto de las circunstancias y las implicaciones del mundo real.

La integridad de los datos, se refiere a las características que determinan la confiabilidad de la información, en términos de su validez física y lógica. La integridad de los datos se basa en parámetros tales como, la precisión, la validez y la coherencia de los datos en todo su ciclo de vida.

Es la ausencia de cambios involuntarios en la información, entre dos actualizaciones sucesivas o modificaciones en los registros de datos. la integridad de datos se puede considerar como un polo opuesto a la corrupción de datos, que hace que la información no sea efectiva para cumplir los requisitos de datos deseados.

Explorando la calidad de los datos frente a la integridad de los datos

Básicamente, la integridad de los datos es un subconjunto de la calidad de los datos, que se relaciona con las características más allá de la validez de los datos, tal como describimos a continuación:

1. Completitud

Una indicación de la amplitud de los datos disponibles, como una proporción de todo el conjunto de datos posible para abordar los requisitos de información específicos. Esta proporcionalidad se mide como un porcentaje y se define en función de variables específicas y reglas comerciales.

Por ejemplo, considera una lista de los registros de salud de los pacientes que visitan el centro médico entre fechas específicas y ordenados por nombre y apellido.

El recurso de datos se considerará completo al 100%, incluso si no incluye la dirección o los números de teléfono de los pacientes, pero incluye todos los registros de salud necesarios, el nombre y los apellidos en fechas específicas. El porcentaje de integridad se reduce en ausencia de cualquier elemento de datos críticos.

2. Singularidad

Una medida discreta de la duplicación de elementos de datos identificados, dentro de un conjunto de datos o en comparación con su contraparte en otro conjunto de datos, que cumple con las mismas especificaciones de información o reglas de negocio. Por ejemplo, considera la misma lista de registros de salud que se mencionó anteriormente, que debe cubrir 100 pacientes según la evaluación del mundo real. Si la lista contiene más de 100 elementos, entonces uno o más pacientes deben tener sus datos duplicados, y enumerados como una entidad separada.

Dependiendo de las circunstancias y los requisitos comerciales para el análisis de los datos, esta duplicación podría dar lugar a resultados erróneos e imprecisiones.

Matemáticamente, la singularidad se puede definir como 100 por ciento si la cantidad de elementos de datos en el contexto del mundo real es única e igual a la cantidad de elementos de datos identificados en el conjunto de datos disponible.

3. Puntualidad

El grado en que los datos están actualizados y disponibles dentro de un marco de tiempo, duración y duración aceptables. El valor de las decisiones basadas en datos no solo depende de la exactitud de la información sino también de respuestas rápidas y oportunas.

El tiempo de ocurrencia de los eventos del mundo real asociados se considera como una referencia y la medida se evalúa de forma continua.

El valor y la precisión de los datos pueden disminuir con el tiempo. Por ejemplo, los datos sobre el número de incidentes de tráfico de hace varios años pueden no ser completamente relevantes para tomar decisiones sobre los requisitos de la infraestructura vial para el futuro inmediato.

4. Validez

Una medida de conformidad con los requisitos empresariales definidos y la sintaxis de su definición. El alcance de la sintaxis puede incluir el tipo permitido, rango, formato y otros atributos de preferencia.

Se mide como una proporción porcentual de elementos de datos válidos en comparación con los conjuntos de datos disponibles.

En el contexto de la Integridad de los Datos, la validez de los datos abarca las relaciones entre los elementos de datos que pueden rastrearse y conectarse a otras fuentes de datos con fines de validación.

Si no se establecen enlaces de elementos de datos válidos al contexto del mundo real, se puede considerar que la información es inadecuada en términos de su integridad.

La validez de los datos es una de las dimensiones críticas de la calidad de los datos y se mide junto con los parámetros relacionados que definen la integridad, la precisión y la coherencia de los datos, todos los cuales también afectan a la integridad de los datos.

5. Exactitud

El grado en que el elemento de datos describe correctamente el objeto en el contexto del contexto y los atributos del mundo real apropiados.

contexto del mundo real puede identificarse como una versión única de la verdad establecida y utilizarse como referencia para identificar la desviación de los elementos de datos de esta referencia.

Las especificaciones de las referencias del mundo real se pueden basar en los requisitos del negocio y todos l os elementos de datos que reflejan con precisión las características de los objetos del mundo real dentro de las especificaciones permitidas se pueden considerar como una información precisa.

La precisión de los datos afecta directamente la corrección de las decisiones y debe considerarse como un componente clave para las prácticas de análisis de datos.

6. Consistencia

Esta medida representa la ausencia de diferencias entre los elementos de datos que representan los mismos objetos en función de requisitos de información específicos. Los datos se pueden comparar por consistencia dentro de la misma base de datos o en comparación con otros conjuntos de datos de especificaciones similares.

La medición discreta se puede utilizar como una evaluación de la calidad de los datos y se puede medir como un porcentaje de los datos que reflejan la misma información que la prevista para todo el conjunto de datos.

Por el contrario, los datos inconsistentes pueden incluir la presencia de atributos que no se esperan para la información prevista.

Por ejemplo, un conjunto de datos que contiene información sobre los usuarios de la aplicación se considera inconsistente si el recuento de usuarios activos es mayor que el número de usuarios registrados.

Conclusión relevancia de la integridad de los datos

La comparación de Calidad de Datos vs Integridad de Datos se centra principalmente en la dimensión de validez asociada con los datos. En el contexto de la integridad de los datos, los atributos de precisión y coherencia de la integridad de los datos también están estrechamente relacionados, seguidos por la integridad de la información.

La puntualidad y la singularidad de los datos son más útiles para comprender la calidad general de los datos en lugar de la integridad de la información. Además de estas seis dimensiones clave de la calidad de los datos, cada organización puede usar sus propias métricas y atributos para comprender el verdadero valor que la información disponible tiene para ellos.

BMC Helix Client Management optimiza su solución de administración de servicios para ofrecer una administración completa y automatizada de extremos, a fin de brindar un excelente servicio a los usuarios finales, reducir los costos, mantener el cumplimiento de normativas y minimizar los riesgos de seguridad.

¿Estás listo para probar BMC Helix Client Management? Ponte en contacto con nuestro equipo de especialistas para obtener más información sobre cómo puedes transformar las necesidades de tus aplicaciones.

Consulta la información original en inglés.

¿Cómo alcanzar la transformación digital con Low-Code?

Low-Code puede ser una herramienta que te ayude a no fallar en tu intento por alcanzar la transformación digital en tu empresa

Fases y mejores prácticas para la gestión de proyectos de software

En este artículo analizamos la gestión de proyectos de software incluidas cuatro fases para ayudar a tu empresa a escalar sus proyectos.

Implementa tu solución de IA Generativa con éxito

La IA generativa es una de las tecnologías emergentes más interesantes en la actualidad y podría revolucionar muchas industrias.

Primeros pasos para la automatización de servicios empresariales sin dolor

Exploramos cuál es la necesidad de automatización de servicios, cuáles son los desafíos, y cómo podemos hacerlo de manera efectiva sin dolor.

Innovaciones en la IA Generativa de BMC HelixGPT

Conoce las nuevas innovaciones de BMC HelixGPT la nueva herramienta de Inteligencia Artificial Generativa de BMC

Conoce los beneficios del nuevo BMC Helix IT Operation Management

Conoce la nueva versión de BMC Helix IT Operation Management ha mejorada sus capacidades de descubrimiento y visibilidad en el entrono de TI.

Paso a paso para lograr una digitalización exitosa

Para 87% de los CIO’s la digitalización es prioridad. Pero, el éxito de las iniciativas de transformación radica en la etapa de madurez.

Orquestación de flujos de trabajo y aplicaciones en el mercado minorista

Los grandes minoristas aprovechan el poder de la orquestación del flujos de trabajo de datos y aplicaciones para optimizar sus suministros.

Capacidades de DevOps habilitadas por Jobs-as-Code

Analizamos Jobs-as-Code como un enfoque de DevOps que ayuda a definir, programar, administrar y monitorear flujos de trabajo en producción.

Obtén visibilidad profunda del entorno de TI con el nuevo BMC Helix ITOM

BMC Helix Operations Management está repleto de nuevas innovaciones que brindan visibilidad incomparable en tiempo real del entorno de TI.