¿Qué es el proceso de minería de datos?

Significado | Concepto | Definición:

Anuncios

El proceso de minería de datos es una herramienta para descubrir patrones estadísticamente significativos en una gran cantidad de datos. Por lo general, implica cinco pasos principales, que incluyen preparación, exploración de datos, creación de modelos, implementación y revisión. Cada paso del proceso implica un conjunto diferente de técnicas, pero la mayoría utiliza alguna forma de análisis estadístico.

La minería de datos es el uso de la lógica de reconocimiento de patrones para identificar tendencias dentro de un conjunto de datos de muestra y extrapolar esta información contra el grupo de datos más grande, mientras que el almacenamiento de datos es el proceso de extraer y almacenar datos para permitir informes más fáciles.

Antes de que pueda comenzar el proceso de minería de datos, los investigadores suelen establecer objetivos de investigación. Este paso de preparación generalmente determina qué tipos de datos deben estudiarse, qué técnicas de minería de datos deben usarse y qué forma tomarán los resultados. Este paso inicial en el proceso puede ser crucial para recopilar información útil.

Anuncios

El objetivo de utilizar herramientas de minería de datos es descubrir patrones ocultos en la información.

El siguiente paso en el proceso de minería de datos es la exploración. Este paso generalmente implica recopilar los datos necesarios de un almacén de información o una entidad de recopilación. Luego, los expertos en minería suelen preparar los conjuntos de datos sin procesar para su análisis. Este paso generalmente consiste en recopilar, limpiar, organizar y verificar todos los datos en busca de errores.

Estos datos preparados generalmente ingresan al tercer paso en el proceso de minería de datos, la construcción de modelos. Para lograr esto, los investigadores generalmente toman pequeñas muestras de prueba de datos y les aplican una variedad de técnicas de minería de datos. El paso de modelado se utiliza a menudo para determinar el mejor método de análisis estadístico necesario para lograr los resultados deseados.

Hay cuatro técnicas principales que se pueden aplicar en el proceso de minería de datos. La primera es la clasificación, que organiza los datos en grupos o categorías predefinidos. En la segunda técnica, llamada agrupación, los investigadores permiten que la computadora organice los datos en grupos, según lo desee. Una tercera técnica de minería de datos busca asociaciones entre variables. El cuarto normalmente busca patrones secuenciales en los datos que pueden usarse para predecir tendencias futuras.

Anuncios

El paso final en el proceso de minería de datos es la implementación. Para hacer esto, las técnicas elegidas en el modelo se aplican al conjunto de datos más grande y se analizan los resultados. El informe que proviene de este paso generalmente muestra los patrones encontrados en todo el proceso, incluidas las clasificaciones, agrupaciones, asociaciones o patrones secuenciales que existen dentro del conjunto de datos.

La revisión suele ser un paso final importante. Esta fase del proceso generalmente implica la repetición de modelos de minería con un nuevo conjunto de datos para asegurarse de que el conjunto principal sea representativo de toda la población de datos. Los resultados no pueden predecir tendencias en la población más grande si la muestra de datos no las representa con precisión.

 

Significado | Concepto | Definición:

Anuncios

El proceso de minería de datos es una herramienta para descubrir patrones estadísticamente significativos en una gran cantidad de datos. Por lo general, implica cinco pasos principales, que incluyen preparación, exploración de datos, creación de modelos, implementación y revisión. Cada paso del proceso implica un conjunto diferente de técnicas, pero la mayoría utiliza alguna forma de análisis estadístico.

La minería de datos es el uso de la lógica de reconocimiento de patrones para identificar tendencias dentro de un conjunto de datos de muestra y extrapolar esta información contra el grupo de datos más grande, mientras que el almacenamiento de datos es el proceso de extraer y almacenar datos para permitir informes más fáciles.

Antes de que pueda comenzar el proceso de minería de datos, los investigadores suelen establecer objetivos de investigación. Este paso de preparación generalmente determina qué tipos de datos deben estudiarse, qué técnicas de minería de datos deben usarse y qué forma tomarán los resultados. Este paso inicial en el proceso puede ser crucial para recopilar información útil.

Anuncios

El objetivo de utilizar herramientas de minería de datos es descubrir patrones ocultos en la información.

El siguiente paso en el proceso de minería de datos es la exploración. Este paso generalmente implica recopilar los datos necesarios de un almacén de información o una entidad de recopilación. Luego, los expertos en minería suelen preparar los conjuntos de datos sin procesar para su análisis. Este paso generalmente consiste en recopilar, limpiar, organizar y verificar todos los datos en busca de errores.

Estos datos preparados generalmente ingresan al tercer paso en el proceso de minería de datos, la construcción de modelos. Para lograr esto, los investigadores generalmente toman pequeñas muestras de prueba de datos y les aplican una variedad de técnicas de minería de datos. El paso de modelado se utiliza a menudo para determinar el mejor método de análisis estadístico necesario para lograr los resultados deseados.

Hay cuatro técnicas principales que se pueden aplicar en el proceso de minería de datos. La primera es la clasificación, que organiza los datos en grupos o categorías predefinidos. En la segunda técnica, llamada agrupación, los investigadores permiten que la computadora organice los datos en grupos, según lo desee. Una tercera técnica de minería de datos busca asociaciones entre variables. El cuarto normalmente busca patrones secuenciales en los datos que pueden usarse para predecir tendencias futuras.

Anuncios

El paso final en el proceso de minería de datos es la implementación. Para hacer esto, las técnicas elegidas en el modelo se aplican al conjunto de datos más grande y se analizan los resultados. El informe que proviene de este paso generalmente muestra los patrones encontrados en todo el proceso, incluidas las clasificaciones, agrupaciones, asociaciones o patrones secuenciales que existen dentro del conjunto de datos.

La revisión suele ser un paso final importante. Esta fase del proceso generalmente implica la repetición de modelos de minería con un nuevo conjunto de datos para asegurarse de que el conjunto principal sea representativo de toda la población de datos. Los resultados no pueden predecir tendencias en la población más grande si la muestra de datos no las representa con precisión.

 

Mira estos Artículos

Subir