Minería
de datos
Las
empresas suelen generar grandes cantidades de información sobre sus procesos
productivos, desempeño operacional, mercados y clientes. Pero el éxito de los
negocios depende por lo general de la habilidad para ver nuevas tendencias o
cambios en las tendencias. Las aplicaciones de data mining pueden identificar
tendencias y comportamientos, no sólo para extraer información, sino también
para descubrir las relaciones en bases de datos que pueden identificar
comportamientos que no muy evidentes. Así una empresa, por ejemplo, podrá
escudriñar entre toda su información acerca del potencial de clientes
dispuestos a comprar un nuevo producto.
Básicamente,
el datamining surge para intentar ayudar a comprender el contenido de un
repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en
algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial
y a las redes neuronales.
Aunque
en datamining cada caso concreto puede ser radicalmente distinto al anterior,
el proceso común a todos ellos se suele componer de cuatro etapas principales:
Determinación de los objetivos.
Trata de la delimitación de los objetivos que el cliente
desea bajo la orientación del especialista en data mining.
Preprocesamiento de los datos.
Se refiere a la selección, la limpieza, el enriquecimiento,
la reducción y la transformación de las bases de datos. Esta etapa consume
generalmente alrededor del setenta por ciento del tiempo total de un proyecto
de data mining.
Determinación del modelo.
Se comienza realizando unos análisis estadísticos de los
datos, y después se lleva a cabo una visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes
áreas de la Inteligencia Artificial.
Análisis de los resultados.
Verifica si los resultados obtenidos son coherentes y los
coteja con los obtenidos por los análisis estadísticos y de visualización
gráfica. El cliente determina si son novedosos y si le aportan un nuevo
conocimiento que le permita considerar sus decisiones.
Administración
del conocimiento
La
administración del conocimiento es una disciplina que articula personas,
procesos, contenido y tecnología, el conocimiento es valioso sólo si es
accesible para quien lo necesita, el conocimiento se origina y reside en el
cerebro de las personas, por lo que la generación, transferencia y aplicación
del conocimiento debe ser fomentada y recompensado, dado que la administración
del conocimiento es más un reto cultural y organizacional que un asunto de
tecnología. La única ventaja sostenible para la empresa se sustenta en el
conocimiento colectivo que posee, cuán eficientemente lo usa y qué tan rápido
aplica los nuevos conocimientos adquiridos.
Entre
las formas de conocimiento explícitas en la organización se encuentran: Las
patentes son una forma de conocimiento codificado, los manuales, la
documentación que revelas los procesos de producción, los reportes y los
archivos de documentos impresos y magnéticos.
La
administración del conocimiento es el proceso mediante el cual el aprendizaje
individual y la experiencia pueden ser representadas, compartidas y utilizadas
para fomentar el mejoramiento del conocimiento individual y el valor
organizacional Es un proceso recurrente que permite: Identificar el
conocimiento que una organización posee o necesita (capital intelectual), para
resolver un problema en específico, implantar mecanismos internos para la
generación, transferencia y aplicación de dicho conocimiento, construir
capacidades críticas que favorecen la innovación, e incrementar el valor de la
organización. La administración del conocimiento implica la conversión del
conocimiento tácito (el que sabe un trabajador específico) en explícito
(conocimiento documentado y replicable) para convertirlo en un activo
estratégico de la organización.
Dicho
en otras palabras implica la adecuada utilización de datos e información para
transformarlos en conocimiento y entendimiento.
1. Alineación y consolidación estratégica
de capitales:
a.
Definición de Sistemas Referenciales
b.
Estructuración y Operacionalización de Capitales
c.
Estrategia de Administración del Conocimiento y Desarrollo de Capitales
Articuladores
2. Administración del Capital Agente
a.
Administración del Aprendizaje Organizacional
b.
Desarrollo de Prácticas de Valor
c.
Desarrollo de Competencias Claves
3. Administración del Capital Instrumental
a.
Métodos y Herramientas para instrumentar las estratégicas de Administración del
Conocimiento
b.
Selección e Implementación de Plataformas Tecnológicas para la Administración
del Conocimiento
c.
Desarrollo de la Base de Conocimiento
Aplicaciones
analíticas
1. Características de las
aplicaciones analíticas.
Una
aplicación analítica no es solo un juego de informes creados al azar. Tiene
cuatro características importantes las cuales son:
1- Integradas
lógicamente: significa que algún grado de lógica comercial es incluido
en la aplicación que ayude a los usuarios a navegar a través de una serie de
tareas.
2- Informes
Interactivos que permitan a los usuarios acceder, analizar y actuar: Esto
significa que los usuarios pueden penetrar con una vista de nivel más alto de
un reporte a niveles más bajos o inferiores para adicionar información.
3- Información
Integrada: Arquitectónicamente una aplicación analítica es un objeto
soportado por un repositorio de almacenamiento de datos de la empresa.
4- Dirección
de un dominio comercial: Las aplicaciones analíticas son definidas por
los requerimientos de información de la actividad comercial, como las ventas,
servicios o infraestructura.
2. Elementos de una aplicación
analítica.
Una
aplicación analítica está compuesta por seis elementos primordiales los cuales
son:
1. Visualización
y percepción: La visualización consiste en un ambiente grafico
amigable al usuario, en la referente a la percepción se enfatiza en la
navegación de las áreas de trabajo.
2. Reportes
y Análisis: Los reportes en vistas de información predefinidas, que
pueden presentarse como estáticas o como documentos interactivos, el análisis
incorpora sofisticados cálculos, algoritmos estadísticos, y visualizaciones
avanzadas para analizar grandes y complejos volumen de información.
3. El
servidor de análisis: es generalmente el responsable de procesar
peticiones utilizando run-time de metadatos definidos y guardándolos en el
almacén del servidor.
4. Lógica
de negocios: Ya se ha mencionado un tipo de lógica comercial, las
reglas de navegación de los usuarios es paso a paso a través de reportes,
vistas, acciones.
5. Modelo
de Datos: es el cerebro de aplicaciones analíticas, a menudo
trabajando en conjunto con la capa semántica de BI, los modelos de datos son
usados en las definiciones de los cubos de OLAP.
6. El
mapeo de las fuentes: Se definen las transformaciones requeridas para
llevar los datos fuentes dentro del modelo de datos designado.
3. Dashboards y Scorecards
Los
scorecards y dashboards proporcionan la información del rendimiento empresarial
a través de sus distintas áreas.
La
popularidad de dashboard está creciendo porque proporciona una interfaz
sumamente intuitiva para supervisar y analizar los datos, existen tres tipos de
Dashboards los cuales son:
1. Operacional: Los
usuarios pueden intervenir en los procesos y actividades comerciales para
solucionar un problema o capitalizar una oportunidad.
2. Táctico: Mide
el progreso y actuación de los departamentos o equipos del proyecto contra
metas establecidas a través de un gerente.
3. Estratégico: Contiene
la métrica que se empleará en la estrategia corporativa. Estos Dashboards son
en forma de cascada donde en cada nivel y se tiene una versión diferente de
métrica moldeada a su dominio comercial.
Sistemas
de reportes
Los
sistemas de reportes tienen como objetivo principal mostrar una visión
general de la situación de la empresa. Consecuentemente, estos muestran la
situación de las operaciones regulares de la empresa para que los
directivos puedan controlar, organizar, planear y dirigir. Los reportes se
pueden visualizar, exportar a otros formatos como PDF, HTML, XML, etc. y
también se pueden imprimir en papel.
Multidimensionalidad
La
información multidimensional se puede encontrar en hojas de cálculo, bases de
datos, etc. Una solución de Inteligencia de Negocios debe de ser capaz de
reunir información dispersa en toda la empresa e incluso en diferentes fuentes
para así proporcionar a los departamentos la accesibilidad, poder y
flexibilidad que necesitan para analizar la información. Por ejemplo, un pronóstico
de ventas de un nuevo producto en varias regiones no está completo si no se
toma en cuenta bien el comportamiento histórico de las ventas de cada región y
la forma en que la introducción de nuevos productos se ha desarrollado en cada
región en cuestión.
Se
representan los datos como una matriz.
- En
los ejes están los criterios de análisis.
- En
los cruces están los valores a analizar.
- A
esta estructura se le llama Cubo o Hipercubo.
Los Cubos o Hipercubos constan de:
-
Dimensiones:
- Criterios de análisis de los datos.
- Macro-objetos del problema.
- Variables independientes.
- Ejes en el hipercubo.
-
Medidas:
- Valores o indicadores a analizar.
- Datos asociados a relaciones entre los
objetos
- problema.
- Variables dependientes.
- Variables en la intersección de las
dimensiones.
Las
bases de datos multidimensionales se utilizan principalmente para crear
aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su
peculiaridad es que por cada dimensión tienen un campo (o columna), y otro
campo por cada métrica o hecho
Datawarehouse
Es la
respuesta de la tecnología de información a la descentralización en la toma de
decisiones. Coloca información de todas las áreas funcionales de la
organización en manos de quien toma las decisiones. También proporciona
herramientas para búsqueda y análisis.
Características
Integrado:
Los datos almacenados en el datawarehouse deben integrarse
en una estructura consistente, por lo que las inconsistencias existentes entre
los diversos sistemas operacionales deben ser eliminadas. La información suele
estructurarse también en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.
Temático:
Sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del datawarehouse. De esta forma, las
peticiones de información sobre clientes serán más fáciles de responder dado
que toda la información reside en el mismo lugar.
Histórico:
El tiempo es parte implícita de la información contenida en
un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad del negocio en el momento presente. Por el contrario, la
información almacenada en el datawarehouse sirve, entre otras cosas, para
realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con
los distintos valores que toma una variable en el tiempo para permitir
comparaciones.
No
volátil:
El almacén de información de un datawarehouse existe para
ser leído, pero no modificado. La información es por tanto permanente,
significando la actualización del datawarehouse la incorporación de los últimos
valores que tomaron las distintas variables contenidas en él sin ningún tipo de
acción sobre lo que ya existía.
Metadatos
Nos permite saber de dónde proviene la información, si es
segura o no, si es confiable o no.
No hay comentarios:
Publicar un comentario