Componentes IN

Minería de datos

Las empresas suelen generar grandes cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no muy evidentes. Así una empresa, por ejemplo, podrá escudriñar entre toda su información acerca del potencial de clientes dispuestos a comprar un nuevo producto.
Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales:

*      Determinación de los objetivos. 

Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.

*      Preprocesamiento de los datos. 

Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.

*      Determinación del modelo. 

Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

*      Análisis de los resultados. 

Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

Administración del conocimiento

La administración del conocimiento es una disciplina que articula personas, procesos, contenido y tecnología, el conocimiento es valioso sólo si es accesible para quien lo necesita, el conocimiento se origina y reside en el cerebro de las personas, por lo que la generación, transferencia y aplicación del conocimiento debe ser fomentada y recompensado, dado que la administración del conocimiento es más un reto cultural y organizacional que un asunto de tecnología. La única ventaja sostenible para la empresa se sustenta en el conocimiento colectivo que posee, cuán eficientemente lo usa y qué tan rápido aplica los nuevos conocimientos adquiridos.
Entre las formas de conocimiento explícitas en la organización se encuentran: Las patentes son una forma de conocimiento codificado, los manuales, la documentación que revelas los procesos de producción, los reportes y los archivos de documentos impresos y magnéticos.
La administración del conocimiento es el proceso mediante el cual el aprendizaje individual y la experiencia pueden ser representadas, compartidas y utilizadas para fomentar el mejoramiento del conocimiento individual y el valor organizacional Es un proceso recurrente que permite: Identificar el conocimiento que una organización posee o necesita (capital intelectual), para resolver un problema en específico, implantar mecanismos internos para la generación, transferencia y aplicación de dicho conocimiento, construir capacidades críticas que favorecen la innovación, e incrementar el valor de la organización. La administración del conocimiento implica la conversión del conocimiento tácito (el que sabe un trabajador específico) en explícito (conocimiento documentado y replicable) para convertirlo en un activo estratégico de la organización.
Dicho en otras palabras implica la adecuada utilización de datos e información para transformarlos en conocimiento y entendimiento.

1. Alineación y consolidación estratégica de capitales:

a. Definición de Sistemas Referenciales
b. Estructuración y Operacionalización de Capitales
c. Estrategia de Administración del Conocimiento y Desarrollo de Capitales Articuladores

2. Administración del Capital Agente

a. Administración del Aprendizaje Organizacional
b. Desarrollo de Prácticas de Valor
c. Desarrollo de Competencias Claves

3. Administración del Capital Instrumental

a. Métodos y Herramientas para instrumentar las estratégicas de Administración del Conocimiento
b. Selección e Implementación de Plataformas Tecnológicas para la Administración del Conocimiento
c. Desarrollo de la Base de Conocimiento

Aplicaciones analíticas

1. Características de las aplicaciones analíticas.

Una aplicación analítica no es solo un juego de informes creados al azar. Tiene cuatro características importantes las cuales son:
1-    Integradas lógicamente: significa que algún grado de lógica comercial es incluido en la aplicación que ayude a los usuarios a navegar a través de una serie de tareas.
2-    Informes Interactivos que permitan a los usuarios acceder, analizar y actuar: Esto significa que los usuarios pueden penetrar con una vista de nivel más alto de un reporte a niveles más bajos o inferiores para adicionar información.
3-    Información Integrada: Arquitectónicamente una aplicación analítica es un objeto soportado por un repositorio de almacenamiento de datos de la empresa.
4-    Dirección de un dominio comercial: Las aplicaciones analíticas son definidas por los requerimientos de información de la actividad comercial, como las ventas, servicios o infraestructura.

2. Elementos de una aplicación analítica.

Una aplicación analítica está compuesta por seis elementos primordiales los cuales son:
1.    Visualización y percepción: La visualización consiste en un ambiente grafico amigable al usuario, en la referente a la percepción se enfatiza en la navegación de las áreas de trabajo.
2.    Reportes y Análisis: Los reportes en vistas de información predefinidas, que pueden presentarse como estáticas o como documentos interactivos, el análisis incorpora sofisticados cálculos, algoritmos estadísticos, y visualizaciones avanzadas para analizar grandes y complejos volumen de información.
3.    El servidor de análisis: es generalmente el responsable de procesar peticiones utilizando run-time de metadatos definidos y guardándolos en el almacén del servidor.
4.    Lógica de negocios: Ya se ha mencionado un tipo de lógica comercial, las reglas de navegación de los usuarios es paso a paso a través de reportes, vistas, acciones.
5.    Modelo de Datos: es el cerebro de aplicaciones analíticas, a menudo trabajando en conjunto con la capa semántica de BI, los modelos de datos son usados en las definiciones de los cubos de OLAP.
6.    El mapeo de las fuentes: Se definen las transformaciones requeridas para llevar los datos fuentes dentro del modelo de datos designado.

3. Dashboards y Scorecards

Los scorecards y dashboards proporcionan la información del rendimiento empresarial a través de sus distintas áreas.
La popularidad de dashboard está creciendo porque proporciona una interfaz sumamente intuitiva para supervisar y analizar los datos, existen tres tipos de Dashboards los cuales son:
1.    Operacional: Los usuarios pueden intervenir en los procesos y actividades comerciales para solucionar un problema o capitalizar una oportunidad.
2.    Táctico: Mide el progreso y actuación de los departamentos o equipos del proyecto contra metas establecidas a través de un gerente.
3.    Estratégico: Contiene la métrica que se empleará en la estrategia corporativa. Estos Dashboards son en forma de cascada donde en cada nivel y se tiene una versión diferente de métrica moldeada a su dominio comercial.

Sistemas de reportes

Los sistemas de reportes tienen como objetivo principal mostrar una visión general de la situación de la empresa. Consecuentemente, estos muestran la situación de las operaciones regulares de la empresa para que los directivos puedan controlar, organizar, planear y dirigir. Los reportes se pueden visualizar, exportar a otros formatos como PDF, HTML, XML, etc. y también se pueden imprimir en papel.

Multidimensionalidad

La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Una solución de Inteligencia de Negocios debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información. Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta bien el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.
Se representan los datos como una matriz. 
- En los ejes están los criterios de análisis. 
- En los cruces están los valores a analizar. 
- A esta estructura se le llama Cubo o Hipercubo.

Los Cubos o Hipercubos constan de:

- Dimensiones:

  - Criterios de análisis de los datos.
  - Macro-objetos del problema.
  - Variables independientes.
  - Ejes en el hipercubo.

- Medidas:

  - Valores o indicadores a analizar.
  - Datos asociados a relaciones entre los objetos
  - problema.
  - Variables dependientes.
  - Variables en la intersección de las dimensiones.
Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho

Datawarehouse

Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.

Características

Integrado:

Los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.

Temático:

Sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.

Histórico:

El tiempo es parte implícita de la información contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.

No volátil:

El almacén de información de un datawarehouse existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.

Metadatos


Nos permite saber de dónde proviene la información, si es segura o no, si es confiable o no.

No hay comentarios:

Publicar un comentario