Transcript
1. ME METO TODO DOLO LOGÍ GÍA A HEF HEFES ESTO TO
1.1. Introducción a la Metodología HEFESTO
HEFESTO es una etodología !ro!ia" cu#a !ro!uesta est$ %undaentada en una u# a!lia in&estigación" co!aración de etodologías e'istentes" e'!eriencias !ro!ias en !rocesos de con%ección de alacenes de datos. (a)e destacar *ue HEFESTO est$ en continua e&olución" # se +an tenido en cuenta" coo gran &alor agregado" todos los %eed)ac,s *ue +an a!ortado *uienes +an utili-ado esta etodología en di&ersos !aíses # con di&ersos %ines.
La idea !rinci!al" es co!render cada !aso *ue se reali-ar$" !ara no caer en el tedio de tener *ue seguir un todo al !ie de la letra sin sa)er e'actaente *u se est$ +aciendo" ni !or *u.
La construcción e i!leentación de un D/ !uede ada!tarse u# )ien a cual*uier ciclo de &ida de desarrollo de so%t0are" con la sal&edad de *ue !ara algunas %ases en !articular" las acciones *ue se +an de reali-ar ser$n u# di%erentes. Lo *ue se de)e tener u# en cuenta" es no entrar en la utili-ación de etodologías *ue re*uieran %ases e'tensas de reunión de re*ue re* ueri rii ient entos os # an$ an$lilisi sis" s" %a %ases ses de des desarr arroll ollo o o ono nolílítitico co *u *ue e co conl nlle le&e &e deasiado tie!o # %ases de des!liegue u# largas. Lo *ue se )usca" es entr en trega egarr un una a !r !ri iera era i i!l !le eent entac ació ión n *u *ue e sa satitis% s%ag aga a una !ar !arte te de la lass necesidades" !ara deostrar las &entaas del D/ # oti&ar a los usuarios. La etodología HEFESTO" !uede ser e)e)ida en cual*uier ciclo de &ida *ue cu!la con la condición antes declarada.
(on el %in de *ue se llegue a una total co!rensión de cada !aso o eta!a" se aco!a2ar$ con la i!leentación en una e!resa real" !ara deostrar los resultados *ue se de)en o)tener # ee!li%icar cada conce!to.
1.3. Descri!ción La etodología HEFESTO !uede resuirse a tra&s del siguiente gr$%ico4
(on el %in de *ue se llegue a una total co!rensión de cada !aso o eta!a" se aco!a2ar$ con la i!leentación en una e!resa real" !ara deostrar los resultados *ue se de)en o)tener # ee!li%icar cada conce!to.
1.3. Descri!ción La etodología HEFESTO !uede resuirse a tra&s del siguiente gr$%ico4
(oo se !u (oo !ued ede e a! a!re reci ciar ar"" se co coi ien en-a -a re recol colec ecta tando ndo la lass ne nece cesi sida dades des de in%oración de las usuarias # se o)tienen las !reguntas cla&es del negocio. Luego" se de)en identi%icar los indicadores resultantes de los interrogati&os # sus res!ecti&as !ers!ecti&as de an$lisis" ediante las cuales se construir$ el odelo conce!tual de datos del D/. Des!us" se anali-ar$n los OLT5 !ara deterinar cóo se construir$n los indi in dica cador dores es"" se se2a 2ala larr la lass co corre rres!o s!ond ndenc encia iass co con n lo loss dat datos os %u %uen ente tess # !ar !ara a seleccionar los ca!os de estudio de cada !ers!ecti&a. 6na &e- +ec+o esto" se !asar$ a la construcción del odelo lógico del de!ósito" en donde se de%inir$ cu$l ser$ el ti!o de es*uea *ue se i!leentar$. Seguidaente" se con%eccionar$n las ta)las de diensiones # las ta)las de +ec+os" !ara luego e%ectuar sus res!ecti&as uniones.
5or 7ltio" utili-ando tcnicas de li!ie-a # calidad de datos" !rocesos ETL" etc" se de%inir$n !olíticas # estrategias !ara la (arga Inicial del D/ # su res!ecti&a actuali-ación. 1.8. (aracterísticas Esta etodología cuenta con las siguientes características4
Los o) Los o)e etiti&o &oss # res resul ulta tado doss es! es!era erados dos en ca cada da %a %ase se se di dist stin ingu guen en %$cilente # son sencillos de co!render.
Se )asa en los re*ueriientos re*ueriientos de los usuarios" !or lo cual su estructura es ca!a- de ada!tarse con %acilidad # ra!ide- ante los ca)ios en el negocio.
9educe la resistencia al ca)io" #a *ue in&olucra a los usuarios %inales en cada eta!a !ara *ue toe decisiones res!ecto al co!ortaiento # %unciones del D/.
6tili-a 6tilia od odelo eloss con conce!t ce!tual uales es # lóg lógico icos" s" los cua cuales les son sen sencil cillos los de inter!retar # anali-ar.
Es inde!endiente inde!endiente del ti!o de ciclo de &ida *ue se e!lee !ara conten contener er la etodología.
Es ind nde! e!en endi dien ente te de las +e +err rra aie ient ntas as *u *ue e se ut utililic icen en !a !ara ra su i!leentación.
Es inde!endiente de las estructuras %ísicas *ue contengan el D/ # de su res!ecti&a distri)ución.
(uando se culina con una %ase" los resultados o)tenidos se con&ierten en el !unto de !artida !ara lle&ar a ca)o el !aso siguiente.
Se a!lica tanto !ara Data /are+ouse coo !ara Data Mart.
1.:. E!resa anali-ada
Antes de coen-ar con el !rier !aso en la construcción del Data /are+ /a re+ous ouse" e" es en enest ester er desc descri) ri)ir ir las car caract acterí erísti sticas cas !ri !rinci nci!al !ales es de la
e!resa a la cual se le a!licar$ la etodología HEFESTO" así se !odr$ tene te nerr co coo o )a )ase se un $ $)i )ito to !r !rede ede%i%ini nido do # se co co!re !rend nder$ er$ e eo orr ca cada da decisión *ue se toe con res!ecto a la i!leentación # dise2o del D/. Ade$s" este an$lisis a#udar$ a conocer el %uncionaiento # organi-ación de la e!resa" lo *ue !eritir$ e'ainar e inter!retar de %ora ó!tia las necesidades de in%oración de la isa" coo así ta)in a!o#ar$ a una eor construcción # ada!tación del de!ósito de datos.
1.;. 5asos # a!licación etodológica 1.;.1. An$lisis de 9e*ueriientos
Lo !ri !rie ero ro *u *ue e se +a +ar$ r$ ser ser$ $ id iden entiti%i%icar car lo loss re re*u *uer eri iie ient ntos os de la lass usuar us uaria iass a tr tra& a&s s de !r !reg egunt untas as *u *ue e e' e'!l !lic icititen en lo loss o) o)e etiti&o &oss de su organi-ación. Luego" se anali-ar$n estas !reguntas a %in de identi%icar cu$l cu $les es ser ser$n $n lo loss in indi dicad cador ores es # !e !ers! rs!ec ectiti&a &ass *u *ue e se ser$n r$n to toa adas das en cuenta !ara la construcción del D/. Finalente se con%eccionar$ un odelo conce!tual en donde se !odr$ &isuali-ar el resultado o)tenido en este !rier !aso. Es u# i!ortante tener en cuenta *ue HEFESTO se !uede utili-ar !ara construir un Data /are+ouse o un Data Mart a la &e-" es decir" si se re*uiere construir !or ee!lo dos Data Marts" se de)er$ a!licar la etodología dos &eces" una !or cada Data Mart. Del iso odo" si se anali-an dos $reas de inters de negocio" coo el $rea de <=entas< # <(o!ras<" se de)er$ a!licar la etodología dos &eces.
a> Id Iden entiti%i%ica carr !regu !regunt ntas as
El !r !ri ier er !a !aso so co coi ien en-a -a co con n el ac aco! o!iio de la lass ne nece cesi sida dade dess de in%oración" el cual !uede lle&arse a ca)o a tra&s de u# &ariadas # di%eren di% erentes tes tc tcnic nicas" as" cad cada a una de las cua cuales les !os !oseen een cara caracte cterís rístic ticas as in+erentes # es!ecí%icas" coo !or ee!lo entre&istas" cuestionarios" o)ser&aciones" etc.
El an$lisis de los re*ueriientos de las di%erentes usuarias" es el !unto de !artida de esta etodología" #a *ue ellas son las *ue de)en" en cierto odo" guiar la in&estigación +acia un desarrollo *ue re%lee claraente lo *ue se es!era del de!ósito de datos" en relación a sus %unciones # cualidades. El o)eti&o !rinci!al de esta %ase" es la de o)tener e identi%icar las necesidades de in%oración cla&e de alto ni&el" *ue es esencial !ara lle&ar a ca)o las etas # estrategias de la e!resa" # *ue %acilitar$ una e%ica- # e%iciente toa de decisiones. De)e tenerse en cuenta *ue dic+a in%oración" es la *ue !ro&eer$ el so!orte !ara desarrollar los !asos sucesi&os" !or lo cual" es u# i!ortante *ue se !reste es!ecial atención al rele&ar los datos. 6na %ora de asegurarse de *ue se +a reali-ado un )uen an$lisis" es corro)orar *ue el resultado del iso +aga e'!lícitos los o)eti&os estratgicos !lanteados !or la e!resa *ue se est$ estudiando. Otra %ora de encainar el rele&aiento" es en%ocar las necesidades de in%oración en los !rocesos !rinci!ales *ue desarrolle la e!resa en cuestión. La idea central es" *ue se %orulen !reguntas co!leas so)re el negocio" *ue inclu#an &aria)les de an$lisis *ue se consideren rele&antes" #a *ue son estas las *ue !eritir$n estudiar la in%oración desde di%erentes !ers!ecti&as. 6n !unto i!ortante *ue de)e tenerse u# en cuenta" es *ue la in%oración de)e estar so!ortada de alguna anera !or alg7n OLT5" #a *ue de otra %ora" no se !odr$ ela)orar el D/. (aso !r$ctico4 Se indagó a las usuarias en busca de sus necesidades de información, pero las mismas abarcaban casi todas las actividades de la empresa, por lo cual se les pidió que escogieran el proceso que considerasen más importante en las actividades diarias de la misma y que estuviese soportado de alguna manera por algún OLTP. l proceso elegido fue el de !entas.
A continuación" se !rocedió a identi%icar *u era lo *ue les interesa)a conocer acerca de este !roceso # cu$les eran las &aria)les o !ers!ecti&as *ue de)ían tenerse en cuenta !ara !oder toar decisiones )asadas en ello.
Se les !reguntó cu$les eran seg7n ellas" los indicadores *ue re!resentan de eor odo el !roceso de =entas # *u sería e'actaente lo *ue se desea anali-ar del iso. La res!uesta o)tenida" %ue *ue se de)en tener en cuenta # consultar datos so)re la cantidad de unidades &endidas # el onto total de &entas. Luego se les !reguntó cu$les serían las &aria)les o !ers!ecti&as desde las cuales se consultar$n dic+os indicadores. 5ara si!li%icar esta tarea se les !resentó una serie de ee!los concretos de otros casos siilares. Las !reguntas de negocio o)tenidas %ueron las siguientes4 •
•
Se desea conocer cu$ntas unidades de cada !roducto %ueron &endidas a sus clientes en un !eriodo deterinado. O en otras !ala)ras4 <6nidades &endidas de cada !roducto a cada cliente en un tie!o deterinado<. Se desea conocer cu$l %ue el onto total de &entas de !roductos a cada cliente en un !eriodo deterinado. O en otras !ala)ras4 Identi%icar indicadores # !ers!ecti&as
6na &e- *ue se +an esta)lecido las !reguntas de negocio" se de)e !roceder a su desco!osición !ara descu)rir los indicadores *ue se utili-ar$n # las !ers!ecti&as de an$lisis *ue inter&endr$n. 5ara ello" se de)e tener en cuenta *ue los indicadores" !ara *ue sean realente e%ecti&os son" en general" &alores nuricos # re!resentan lo *ue se desea anali-ar concretaente" !or ee!lo4 saldos" !roedios" cantidades" suatorias" %órulas" etc. En ca)io" las !ers!ecti&as se re%ieren a los o)etos ediante los cuales se *uiere e'ainar los indicadores" con el %in de res!onder a las !reguntas !lanteadas" !or ee!lo4 clientes" !ro&eedores" sucursales" !aíses" !roductos" ru)ros" etc. (a)e destacar" *ue el Tie!o es u# co7nente una !ers!ecti&a. (aso !r$ctico4
A continuación" se anali-ar$n las !reguntas o)tenidas en el !aso anterior # se detallar$n cu$les son sus res!ecti&os indicadores # !ers!ecti&as.
Figura ;.84 (aso !r$ctico" indicadores # !ers!ecti&as.
En síntesis, los indicadores son:
Unidades vendidas. Monto total de ventas. Y las perspectivas de análisis son: Clientes. Productos. Tiempo.
c> Modelo (once!tual
En esta eta!a" se construir$ un odelo conce!tual a !artir de los indicadores # !ers!ecti&as o)tenidas en el !aso anterior.'odelo "onceptual( descripción de alto nivel de la estructura de la base de
datos, en la cual la información es representada a trav)s de ob$etos, relaciones y atributos.
A tra&s de este odelo" se !odr$ o)ser&ar con claridad cu$les son los alcances del !ro#ecto" !ara luego !oder tra)aar so)re ellos" ade$s al !oseer un alto ni&el de de%inición de los datos" !erite *ue !ueda ser !resentado ante las usuarias # e'!licado con %acilidad. La re!resentación gr$%ica del odelo conce!tual es la siguiente4
Figura ;.:4 Modelo (once!tual.
A la i-*uierda se colocan las !ers!ecti&as seleccionadas" *ue ser$n unidas a un ó&alo central *ue re!resenta # lle&a el no)re de la relación *ue e'iste entre ellas. La relación" constitu#e el !roceso o $rea de estudio elegida. De dic+a relación # entrela-adas con %lec+as" se des!renden los indicadores" estos se u)ican a la derec+a del es*uea. (oo !uede a!reciarse en la %igura anterior" el odelo conce!tual !erite de un solo &ista-o # sin !oseer deasiados conociientos !re&ios" co!render cu$les
ser$n los resultados *ue se o)tendr$n" cu$les ser$n las &aria)les *ue se utili-ar$n !ara anali-arlos # cu$l es la relación *ue e'iste entre ellos.
1.;.3. An$lisis de los OL5T Seguidaente" se anali-ar$n las %uentes OLT5 !ara deterinar cóo ser$n calculados los indicadores # !ara esta)lecer las res!ecti&as corres!ondencias entre el odelo conce!tual creado en el !aso anterior # las %uentes de datos. Luego" se de%inir$n *u ca!os se incluir$n en cada !ers!ecti&a. Finalente" se a!liar$ el odelo conce!tual con la in%oración o)tenida en este !aso. a> (on%orar Indicadores En este !aso se de)er$n e'!licitar coo se calcular$n los indicadores" de%iniendo los siguientes conce!tos !ara cada uno de ellos4
Hec+o?s *ue lo co!onen" con su res!ecti&a %órula de c$lculo. 5or ee!lo4 Hec+o1 @ Hec+o3.
Función de suari-ación *ue se utili-ar$ !ara su agregación. 5or ee!lo4 S6M" A=G" (O6T" etc.
(aso !r$ctico4 Los indicadores se calcular$n de la siguiente anera4 <6nidades =endidas<4 o
Hec+os4 6nidades =endidas.
o
Función de suari-ación4 S6M. Aclaración4 el indicador <6nidades =endidas< re!resenta la suatoria de las unidades *ue se +an &endido de un !roducto en !articular.
•
C B5recio de =enta>.
o
Función de suari-ación4 S6M. Aclaración4 el indicador Esta)lecer corres!ondencias El o)eti&o de este !aso" es el de e'ainar los OLT5 dis!oni)les *ue contengan la in%oración re*uerida" coo así ta)in sus características" !ara !oder identi%icar las corres!ondencias entre el odelo conce!tual # las %uentes de datos. La idea es" *ue todos los eleentos del odelo conce!tual estn corres!ondidos en los OLT5. (aso !r$ctico4 En el OLT5 de la e!resa anali-ada" el !roceso de &enta est$ re!resentado !or el diagraa relacional de la siguiente %igura. Diagraa 9elacional4 re!resenta la in%oración a tra&s de entidades" relaciones" cardinalidades" cla&es" atri)utos # erar*uías de generali-ación.
Figura ;.4 (aso !r$ctico" Diagraa 9elacional.
A continuación" se e'!ondr$ la corres!ondencia entre los dos odelos4
Figura ;.4 (aso !r$ctico" corres!ondencia.
Las relaciones identi%icadas %ueron las siguientes4 •
La ta)la <5roductos< se relaciona con la !ers!ecti&a <5roductos<.
•
La ta)la <(lientes< con la !ers!ecti&a <(lientes<.
•
•
El ca!o <%ec+a< de la ta)la . El ca!o i&el de granularidad 6na &e- *ue se +an esta)lecido las relaciones con los OLT5" se de)en seleccionar los ca!os *ue contendr$ cada !ers!ecti&a" #a *ue ser$ a tra&s de estos !or los *ue se e'ainar$n # %iltrar$n los indicadores. 5ara ello" )as$ndose en las corres!ondencias esta)lecidas en el !aso anterior" se de)e !resentar a las usuarias los datos de an$lisis dis!oni)les !ara cada !ers!ecti&a. Es u# i!ortante conocer en detalle *ue signi%ica cada ca!o #?o &alor de los datos encontrados en los OLT5" !or lo cual" es con&eniente in&estigar su sentido" #a sea a tra&s de diccionarios de datos" reuniones con las encargadas del sistea" an$lisis de los datos !ro!iaente dic+os" etc. Luego de e'!oner %rente a las usuarias los datos e'istentes" e'!licando su signi%icado" &alores !osi)les # características" estas de)en decidir cuales son los *ue consideran rele&antes !ara consultar los indicadores # cuales no. (on res!ecto a la !ers!ecti&a Tie!o<" es u# i!ortante de%inir el $)ito ediante el cual se agru!ar$n o suari-ar$n los datos. Sus ca!os !osi)les !ueden ser4 día de la seana" *uincena" es" triestres" seestre" a2o" etc. Al oento de seleccionar los ca!os *ue integrar$n cada !ers!ecti&a" de)e !restarse uc+a atención" #a *ue esta acción deterinar$ la granularidad de la in%oración encontrada en el D/. (aso !r$ctico4 De acuerdo a las corres!ondencias esta)lecidas" se anali-aron los ca!os residentes en cada ta)la a la *ue se +acia re%erencia" a tra&s de dos todos di%erentes. 5riero se e'ainó la )ase de datos !ara intuir los signi%icados de cada ca!o" # luego se consultó con el encargado del sistea so)re algunos as!ectos de los cuales no se co!rendía su sentido. De todas %oras" # coo !uede a!reciarse en el diagraa de relacional antes e'!uesto" los no)res de los ca!os son )astante e'!lícitos # se deducen con %acilidad" !ero a7n así %ue necesario in&estigarlos !ara e&itar cual*uier ti!o de incon&enientes.
•
o
o
(on res!ecto a la !ers!ecti&a <(lientes<" los datos dis!oni)les son los siguientes4 id(liente4 es la cla&e !riaria de la ta)la <(lientes<" # re!resenta uní&ocaente a un cliente en !articular. (odigo4 re!resenta el código del cliente" este ca!o es calculado de acuerdo a una co)inación de las iniciales del no)re del cliente" el gru!o al *ue !ertenece # un n7ero increental.
o
9a-onSoc4 no)re o ra-ón social del cliente.
o
Tele%ono14 n7ero de tel%ono del cliente.
o
Tele%ono34 segundo n7ero tele%ónico del cliente.
o
Fa'14 n7ero de %a' del cliente.
o
Fa'34 segundo n7ero de %a' del cliente.
o
Mail14 dirección de correo electrónico del cliente.
o
Mail34 segunda dirección de correo del cliente.
o
o
o
o
o
o
o
idSitFiscal4 re!resenta a tra&s de una cla&e %or$nea el ti!o de situación %iscal *ue !osee el cliente. 5or ee!lo4 (onsuidor Final" E'ento" 9es!onsa)le o Inscri!to" 9es!onsa)le Inscri!to. (6IT4 n7ero de (.6.I.T. del cliente. (on&enioMultilateral4 indica si el cliente !osee o no con&enio ultilateral. DG94 n7ero de D.G.9. del cliente. id(lasi%icación4 re!resenta a tra&s de una cla&e %or$nea la clasi%icación del cliente. 5or ee!lo4 Mu# ueno" ueno" 9egular" Malo" Mu# Malo. idota4 re!resenta a tra&s de una cla&e %or$nea una o)ser&ación reali-ada acerca del cliente. (taHa)ilitada4 indica si el cliente !osee su cuenta +a)ilitada.
o
o
o
•
o
o
o
id9u)ro4 re!resenta a tra&s de una cla&e %or$nea el gru!o al *ue !ertenece el cliente. 5or ee!lo4 ancos" (onstrucción" Educación 5ri&ada" Educación 57)lica" 5articulares. id(uenta(onta)le4 re!resenta la cuenta conta)le asociada al cliente" la cual se utili-ar$ !ara i!utar los o&iientos conta)les *ue este genere. Eliinado4 indica si el cliente %ue eliinado o no. Si %ue eliinado" no %igura en las listas de clientes actuales. En la !ers!ecti&a <5roductos<" los datos *ue se !ueden utili-ar son los siguientes4 id!rod4 es la cla&e !riaria de la ta)la <5roductos<" # re!resenta uní&ocaente a un !roducto en !articular. stoc,4 stoc, actual del !roducto. stoc,in4 stoc, ínio del !roducto" se utili-a !ara dar alerta si el stoc, actual est$ cerca del iso" al ras o si #a lo su!eró.
o
5recio4 !recio de &enta del !roducto.
o
Detalle4 no)re o descri!ción del !roducto.
o
o
o
o
o
o
id9u)ro4 re!resenta a tra&s de una cla&e %or$nea el ru)ro al *ue !ertenece el !roducto. idMarca4 re!resenta a tra&s de una cla&e %or$nea la arca a la *ue !ertenece el !roducto. stoc,MA4 stoc, $'io del !roducto. Al igual *ue Modelo (once!tual a!liado En este !aso" # con el %in de gra%icar los resultados o)tenidos en los !asos anteriores" se a!liar$ el odelo conce!tual" colocando )ao cada !ers!ecti&a los ca!os seleccionados # )ao cada indicador su res!ecti&a %órula de c$lculo. Gr$%icaente4
Figura ;.4 Modelo (once!tual a!liado.
;.;.8 5aso 8> Modelo lógico del D/
A continuación" se con%eccionar$ el odelo lógico de la estructura del D/" teniendo coo )ase el odelo conce!tual *ue #a +a sido creado. 5ara ello" !riero se de%inir$ el ti!o de odelo *ue se utili-ar$ # luego se lle&ar$n a ca)o las acciones !ro!ias al caso" !ara dise2ar las ta)las de diensiones # de +ec+os. Finalente" se reali-ar$n las uniones !ertinentes entre estas ta)las. 'odelo Lógico( representación de una estructura de datos, que puede procesarse y almacenarse en algún S*+.
;.;.8.1. a> Ti!o de Modelo Lógico del D/ Se de)e seleccionar cu$l ser$ el ti!o de es*uea *ue se utili-ar$ !ara contener la estructura del de!ósito de datos" *ue se ada!te eor a los re*ueriientos # necesidades de las usuarias. Es u# i!ortante de%inir o)eti&aente si se e!lear$ un es*uea en estrella" constelación o co!o de nie&e" #a *ue esta decisión a%ectar$ considera)leente la ela)oración del odelo lógico.
(aso !r$ctico4 El es*uea *ue se utili-ar$ ser$ en estrella" de)ido a sus características" &entaas # di%erencias con los otros es*ueas.
;.;.8.3. )> Ta)las de diensiones En este !aso se de)en dise2ar las ta)las de diensiones *ue %oraran !arte del D/. 5ara los tres ti!os de es*ueas" cada !ers!ecti&a de%inida en en odelo conce!tual constituir$ una ta)la de diensión. 5ara ello de)er$ toarse cada !ers!ecti&a con sus ca!os relacionados # reali-arse el siguiente !roceso4 •
Se elegir$ un no)re *ue identi%i*ue la ta)la de diensión. •
•
Se a2adir$ un ca!o *ue re!resente su cla&e !rinci!al. •
•
Se rede%inir$n los no)res de los ca!os si es *ue no son lo su%icienteente intuiti&os. •
Gr$%icaente4 •
Figura ;.14 Dise2o de ta)las de diensiones.
5ara los es*ueas co!o de nie&e" cuando e'istan erar*uías dentro de una ta)la de diensión" esta ta)la de)er$ ser norali-ada. 5or ee!lo" se toar$ coo re%erencia la siguiente ta)la de diensión # su res!ecti&as relaciones !adreN+o entre sus ca!os4
Figura ;.114 Perar*uía de Ta)las de +ec+os En este !aso" se de%inir$n las ta)las de +ec+os" *ue son las *ue contendr$n los +ec+os a tra&s de los cuales se construir$n los indicadores de estudio. •
5ara los es*ueas en estrella # co!o de nie&e" se reali-ar$ lo siguiente4 •
o
Se le de)er$ asignar un no)re a la ta)la de +ec+os *ue re!resente la in%oración anali-ada" $rea de in&estigación" negocio en%ocado" etc. o
o
Se de%inir$ su cla&e !riaria" *ue se co!one de la co)inación de las cla&es !riarias de cada ta)la de diensión relacionada. o
o
Se crear$n tantos ca!os de +ec+os coo indicadores se +a#an de%inido en el odelo conce!tual # se les asignar$ los isos no)res *ue estos. En caso *ue se !re%iera" !odr$n ser no)rados de cual*uier otro odo. o
Gr$%icaente4 o
Figura ;.14 Ta)la de +ec+os.
•
5ara los es*ueas constelación se reali-ar$ lo siguiente4 •
o
Las ta)las de +ec+os se de)en con%eccionar teniendo en cuenta el an$lisis de las !reguntas reali-adas !or las usuarias en !asos anteriores # sus res!ecti&os indicadores # !ers!ecti&as. o
o
(ada ta)la de +ec+os de)e !oseer un no)re *ue la identi%i*ue" contener sus +ec+os corres!ondientes # su cla&e de)e estar %orada !or la co)inación de las cla&es de las ta)las de diensiones relacionadas. o
o
Al dise2ar las ta)las de +ec+os" se de)er$ tener en cuenta4 o
(aso 14 Si en dos o $s !reguntas de negocio %iguran los isos indicadores !ero con di%erentes !ers!ecti&as de an$lisis" e'istir$n tantas ta)las de +ec+os coo !reguntas cu!lan esta condición. 5or ee!lo4
Figura ;.14 (aso 1" !reguntas.
Entonces se o)tendr$4
Figura ;.14 (aso 1" dise2o de ta)las de +ec+os.
(aso 34 Si en dos o $s !reguntas de negocio %iguran di%erentes indicadores con di%erentes !ers!ecti&as de an$lisis" e'istir$n tantas ta)las de +ec+os coo !reguntas cu!lan esta condición. 5or ee!lo4
Figura ;.1Q4 (aso 3" !reguntas.
Entonces se o)tendr$4
Figura ;.34 (aso 3" dise2o de ta)las de +ec+os.
(aso 84 Si el conunto de !reguntas de negocio cu!len con las condiciones de los dos !untos anteriores se de)er$n uni%icar a*uellos interrogantes *ue !osean di%erentes indicadores !ero iguales !ers!ecti&as de an$lisis" !ara luego reanudar el estudio de las !reguntas. 5or ee!lo4
Figura ;.314 (aso 8" !reguntas.
Se uni%icar$n en4
Figura ;.334 (aso 8" uni%icación.
(aso !r$ctico4 A continuación" se con%eccionar$ la ta)la de +ec+os4 •
•
•
La ta)la de +ec+os tendr$ el no)re =ETAS<. Su cla&e !rinci!al ser$ la co)inación de las cla&es !rinci!ales de las ta)las de diensiones antes de%inidas4 id(liente<" id5roducto< e idFec+a<. Se crear$n dos +ec+os" *ue se corres!onden con los dos indicadores # ser$n reno)rados" 6nidades =endidas< !or (antidad< # Monto Total de =entas< !or MontoTotal<. En el gr$%ico siguiente se !uede a!reciar eor este !aso4
Figura ;.384 (aso !r$ctico" dise2o de la ta)la de +ec+os.
;.;.8.:. d> 6niones 5ara los tres ti!os de es*ueas" se reali-ar$n las uniones corres!ondientes entre sus ta)las de diensiones # sus ta)las de +ec+os.
(aso !r$ctico4 Se reali-ar$n las uniones !ertinentes" de acuerdo corres!onda4
Figura ;.3:4 (aso !r$ctico" uniones.
;.;.; 5aso :> Integración de Datos
6na &e- construido el odelo lógico" se de)er$ !roceder a !o)larlo con datos" utili-ando tcnicas de li!ie-a # calidad de datos" !rocesos ETL" etc.R luego se de%inir$n las reglas # !olíticas !ara su res!ecti&a actuali-ación" así coo ta)in los !rocesos *ue la lle&ar$n a ca)o.
;.;.:.1 a> (arga Inicial De)eos en este !aso reali-ar la (arga Inicial al D/" !o)lando el odelo de datos *ue +eos construido anteriorente. 5ara lo cual de)eos lle&ar adelante una serie de tareas )$sicas" tales coo li!ie-a de datos" calidad de datos" !rocesos ETL" etc.
La reali-ación de estas tareas !ueden contener una lógica realente co!lea en algunos casos. A%ortunadaente" en la actualidad e'isten uc+os so%t0ares *ue se !ueden e!lear a tal %in" # *ue nos %acilitar$n el tra)ao. Se de)e e&itar *ue el D/ sea cargado con &alores %altantes o anóalos" así coo ta)in se de)en esta)lecer condiciones # restricciones !ara asegurar *ue solo se utilicen los datos de inters. (uando se tra)aa con un es*uea constelación" +a# *ue tener !resente *ue &arias ta)las de diensiones ser$n co!artidas con di%erentes ta)las de +ec+os" #a *ue !uede darse el caso de *ue algunas restricciones a!licadas so)re una ta)la de diensión en !articular !ara anali-ar una ta)la de +ec+os" se !uedan contra!oner con otras restricciones o condiciones de an$lisis de otras ta)las de +ec+os. 5riero se cargar$n los datos de las diensiones # luego los de las ta)las de +ec+os" teniendo en cuenta sie!re" la correcta corres!ondencia entre cada eleento. En el caso en *ue se est utili-ando un es*uea co!o de nie&e" cada &e- *ue e'istan erar*uías de diensiones" se coen-ar$n cargando las ta)las de diensiones del ni&el $s general al $s detallado. (oncretaente" en este !aso se de)er$ registrar en detalle las acciones lle&adas a ca)o con los di%erentes so%t0ares. 5or ee!lo" es u# co7n *ue sisteas ETL tra)aen con !asos # relaciones" en donde cada !aso reali-a una tarea en !articular del !roceso ETL # cada relación indica +acia donde de)e dirigirse el %luo de datos. En este caso lo *ue se de)e +acer es e'!licar *ue +ace el !roceso en general # luego *ue +ace cada !aso #?o relación. Es decir" se !artir$ de lo $s general # se ir$ a lo $s es!ecí%ico" !ara o)tener de esta anera una &isión general # detallada de todo el !roceso. Es i!ortante tener !resente" *ue al cargar los datos en las ta)las de +ec+os !ueden utili-arse !reagregaciones" #a sea al ni&el de granularidad de la isa o a otros ni&eles di%erentes.
(aso !r$ctico4 5ara si!li%icar la a!licación del ee!lo" el caso !r$ctico solo se centrar$ en los as!ectos $s i!ortantes del !roceso ETL" o)&iando entrar en detalle de cóo se reali-an algunas %unciones #?o !asos. El !roceso ETL !lanteado !ara la (arga Inicial es el siguiente4
Figura ;.34 (aso !r$ctico" (arga Inicial.
Las tareas *ue lle&a a ca)o este !roceso son4 •
•
Inicio4 inicia la eecución de los !asos en el oento en *ue se le indi*ue. Esta)lecer &aria)les Fec+aDesde # Fec+aHasta4 esta)lece dos &aria)les glo)ales *ue ser$n utili-adas !osteriorente !or algunos !asos. o
o
•
•
5ara la &aria)le Fec+aDesde se o)tiene el &alor de la %ec+a en *ue se reali-ó la !riera &enta. 5ara la &aria)le Fec+aHasta se o)tiene el &alor de la %ec+a actual.
(arga de Diensión (LIETE4 eecuta el contenedor de !asos *ue cargar$ la diensión (LIETE" $s adelante se detallar$ el iso. (arga de Diensión 59OD6(TO4 eecuta el contenedor de !asos *ue cargar$ la diensión 59OD6(TO" $s adelante se detallar$ el iso.
•
•
(arga de Diensión FE(HA4 eecuta el contenedor de !asos *ue cargar$ la diensión FE(HA" $s adelante se detallar$ el iso. (arga de Ta)la de Hec+os =ETAS4 eecuta el contenedor de !asos *ue cargar$ la ta)la de +ec+os =ETAS" $s adelante se detallar$ el iso.
A continuación" se es!eci%icar$n las tareas lle&adas a ca)o !or (arga de Diensión (LIETE. Este !aso es un contenedor de !asos" así *ue inclu#e las siguientes tareas4
Figura ;.34 (aso !r$ctico" (arga de Diensión (LIETE.
•
O)tener datos de OLT54 o)tiene a tra&s de una consulta SJL los datos del OLT5 necesarios !ara cargar la diensión (LIETE. Se toar$ coo %uente de entrada la ta)la (lientes< del OLT5 encionado anteriorente. Se consultó con las usuarias # se a&eriguó *ue desea)an tener en cuenta solo a*uellos clientes *ue no estn eliinados # *ue tengan su cuenta +a)ilitada. Es i!ortante destacar *ue aun*ue e'istían nuerosos o&iientos de clientes *ue en la actualidad no !oseen su cuenta +a)ilitada o *ue %iguran
coo eliinados" se decidió no incluirlos de)ido a *ue el n%asis est$ !uesto en anali-ar los datos a tra&s de a*uellos clientes *ue no cuentan con estas condiciones. Los clientes eliinados son re%erenciados ediante el ca!o Eliinado<" en el cual un &alor 1< indica *ue este %ue eliinado" # un &alor < *ue a7n !eranece &igente. (uando se e'ainaron los registros de la ta)la" !ara uc+os clientes no +a)ía ning7n &alor asignado !ara este ca!o" lo cual" seg7n counicó el encargado del sistea" se de)ía a *ue este se agregó !oco des!us de +a)erse creado la )ase de datos inicial" ra-ón !or la cual e'istían &alores %altantes. Ade$s" coentó *ue en el sistea" si un cliente !osee en el ca!o Eliinado< un &alor < o un &alor %altante" es considerado coo &igente. (on res!ecto a la cuenta +a)ilitada" el ca!o del OLT5 *ue le +ace ención es (taHa)ilitada<" # un &alor < indica *ue no est$ +a)ilitada # un &alor 1< *ue sí. Seguidaente" se e'!ondr$ la sentencia SJL *ue contiene este !aso4
Figura ;.34 (aso !r$ctico" (LIETE N O)tener datos de OLT5.
•
(argar (LIETE4 alacena en la ta)la de diensión (LIETE los datos o)tenidos en el !aso anterior.
A continuación" se es!eci%icar$ las tareas lle&adas a ca)o !or (arga de Diensión 59OD6(TO. Este !aso es un contenedor de !asos" así *ue inclu#e las siguientes tareas4
Figura ;.3Q4 (aso !r$ctico" (arga de Diensión 59OD6(TO.
•
O)tener datos de OLT54 o)tiene a tra&s de una consulta SJL los datos del OLT5 necesarios !ara cargar la diensión 59OD6(TO. Las %uentes *ue se utili-ar$n" son las ta)las 5roductos< # Marcas<. En este caso" aun*ue e'istían !roductos eliinados" las usuarias decidieron *ue esta condición no %uese toada en cuenta" #a *ue +a)ían o&iientos *ue +acían re%erencia a !roductos con este estado. Es necesario reali-ar una unión entre la ta)la 5roductos< # Marcas<" !or lo cual se de)ió asegurar *ue ning7n !roducto +iciera ención a alguna arca *ue no e'istiese" # se toaron edidas contra su %utura a!arición. El SJL *ue contiene este !aso es el siguiente4
Figura ;.8 4 (aso !r$ctico" 59OD6(TO N O)tener datos de OLT5.
•
"argar P-O"TO( almacena en la tabla de dimensión P-O"TO los datos obtenidos en el paso anterior.
/ continuación, se especificarán las tareas llevadas a cabo por 0"arga de imensión 1"2/0. ste paso es un contenedor de pasos, as& que incluye las siguientes tareas(
Figura ;.81 4 (aso !r$ctico" (arga de Diensión FE(HA.
5ara generar esta ta)la de diensión" in%alta)le en todo D/" e'isten &arias +erraientas # utilidades de so%t0are *ue !ro!orcionan di&ersas o!ciones !ara su con%ección. 5ero" si no se cuenta con ninguna" se !uede reali-ar anualente o ediante alg7n !rograa" llenando los datos en un arc+i&o" ta)la" +oa de c$lculo" etc" # luego e'!ort$ndolos a donde se re*uiera. Lo *ue se +i-o" %ue reali-ar un !rocediiento *ue +ace lo siguiente4 •
9eci)e coo !ar$etros los &alores de Fec+aDesde # Fec+aHasta.
•
9ecorre una a una las %ec+as *ue se encuentran dentro de este inter&alo. •
Anali-a cada %ec+a # reali-a una serie de o!eraciones !ara crear los &alores de los ca!os de la ta)la de la diensión FE(HA4
•
Figura ;.834 (aso !r$ctico" datos de FE(HA.
•
•
o
o
o
idFec+a DAKB%ec+a>.
KEA9B%ec+a>C1
@
MOTHB%ec+a>C1
@
A2o KEA9B%ec+a>. Triestre (ASE /HE J6A9TE9B%ec+a> 1 t+en U1er TriU ... ED.
o
V Mes (ASE /HE MOTHB%ec+a> 1 t+en UEneroU ... ED.
o
Inserta los &alores o)tenidos en la ta)la de diensión FE(HA.
(oo !uede o)ser&arse" la cla&e !rinci!al idFec+a es un ca!o nurico re!resentado !or el %orato ####dd.
A continuación" se es!eci%icar$ las tareas lle&adas a ca)o !or (arga de Ta)la de Hec+os =ETAS. Este !aso es un contenedor de !asos" así *ue inclu#e las siguientes tareas4
Figura ;.884 (aso !r$ctico" (arga de Ta)la de Hec+os =ETAS.
•
O)tener datos de OLT54 o)tiene a tra&s de una consulta SJL los datos del OLT5 necesarios !ara cargar la ta)la de +ec+os =ETAS.
5ara la con%ección de la ta)la de +ec+os" se toaron coo %uente las ta)las Facturas=entas< # Detalles=enta<. Al igual *ue en las ta)las de diensiones" se recolectaron las condiciones *ue de)en cu!lir los datos !ara considerarse de inters" # en este caso" se tra)aar$ solaente con a*uellas %acturas *ue no +a#an sido anuladas. Se in&estigó al res!ecto" # se llegó a la conclusión de *ue el ca!o *ue da dic+a in%oración en Anulada< de la ta)la Facturas=entas< # si el iso !osee el &alor 1< signi%ica *ue e%ecti&aente %ue anulada. Otro !unto i!ortante a tener en cuenta es *ue la %ec+a se de)e con&ertir al %orato nurico ####dd<. Se decidió a!licar una !reagregación a los +ec+os *ue %orar$n !arte de la ta)la de +ec+os" es !or esta ra-ón *ue se utili-ar$ la cl$usula G9O65 K !ara agru!ar todos los registros a tra&s de las cla&es !riarias de esta ta)la. La sentencia SJL *ue contiene este !aso %ue la siguiente4
Figura ;.8:4 (aso !r$ctico" =ETAS N O)tener datos de OLT5..
•
(argar =ETAS4 alacena en la ta)la de +ec+os =ETAS los datos o)tenidos en el !aso anterior.
;.;.:.3 )> Actuali-ación (uando se +a#a cargado en su totalidad el D/" se de)en esta)lecer sus !olíticas # estrategias de actuali-ación o re%resco de datos. 6na &e- reali-ado esto" se tendr$n *ue lle&ar a ca)o las siguientes acciones4 •
•
Es!eci%icar las tareas de li!ie-a de datos" calidad de datos" !rocesos ETL" etc." *ue de)er$n reali-arse !ara actuali-ar los datos del D/. Es!eci%icar de %ora general # detallada las acciones *ue de)er$ reali-ar cada so%t0are.
(aso !r$ctico4 Las !olíticas de Actuali-ación *ue se +an con&enido con las usuarias son las siguientes4 •
•
•
•
•
La in%oración se re%rescar$ todos los días a las doce de la noc+e. Los datos de las ta)las de diensiones 59OD6(TO< # (LIETE< ser$n cargados totalente cada &e-. Los datos de la ta)la de diensión FE(HA< se cargar$n de anera increental teniendo en cuenta la %ec+a de la 7ltia actuali-ación. Los datos de la ta)la de +ec+os *ue corres!onden al 7ltio es B8 días> a !artir de la %ec+a actual" ser$n ree!la-ados cada &e-. Estas acciones se reali-ar$n durante un !eriodo de !rue)a" !ara anali-ar cu$l es la anera $s e%iciente de generar las actuali-aciones" )asadas en el estudio de los ca)ios *ue se !roducen en los OLT5 # *ue a%ectan al contenido del D/.
5ara e&itar *ue se e'tienda deasiado la a!licación del ee!lo" el caso !r$ctico solo incluir$ lo *ue de)ería reali-ar el !roceso ETL !ara actuali-ar el D/. El !roceso ETL !ara la actuali-ación del D/ es u# siilar al de (arga Inicial" !ero cuenta con las siguientes di%erencias4 •
•
Inicio4 iniciar$ la eecución de los !asos todos los días a las doce de la noc+e. Esta)lecer &aria)les Fec+aDesde # Fec+aHasta4 o
o
•
•
•
•
La &aria)le Fec+aDesde o)tendr$ el &alor resultante de restarle a la %ec+a actual treinta días. La &aria)le Fec+aHasta o)tendr$ el &alor de la %ec+a actual.
(arga de Diensión (LIETE4 a la serie de tareas *ue reali-a este !aso" se le anteceder$ un nue&o !aso *ue )orrar$ los datos de la diensión (LIETE. (arga de Diensión 59OD6(TO4 a la serie de tareas *ue reali-a este !aso" se le anteceder$ un nue&o !aso *ue )orrar$ los datos de la diensión 59OD6(TO. (arga de Diensión FE(HA4 en este !aso" en &e- de reci)ir el &alor de la &aria)le Fec+aDesde" se toar$ la %ec+a del 7ltio registro cargado en la diensión FE(HA. (arga de Ta)la de Hec+os =ETAS4 o
o
a la serie de tareas *ue reali-a este !aso" se le anteceder$ un nue&o !aso *ue )orrar$ los datos de la ta)la de HE(HOS corres!ondientes al inter&alo entre Fec+aDesde # Fec+aHasta. en el !aso O)tener datos de OLT5 se le agregar$ a la sentencia SJL la siguiente condición4
/HE9E Facturas=enta.Fec+a W XFec+aDesdeY AD Facturas=enta.Fec+a Z XFec+aHastaY
1.. (reación de (u)os Multidiensionales A continuación se crear$ un cu)o ultidiensional de ee!lo" *ue ser$ llaado <(u)o de =entas< # *ue estar$ )asado en el odelo lógico dise2ado en el caso !r$ctico de la etodología He%esto4
Figura ;.84 (aso !r$ctico" odelo lógico.
La creación de este cu)o tiene las siguientes %inalidades4 •
Ee!li%icar la creación de cu)os ultidiensionales. •
•
5ro!iciar la correcta distinción entre +ec+os de una ta)la de +ec+os e indicadores de un cu)o. •
•
5ro!iciar la correcta distinción entre ca!os de una ta)la de diensión # atri)utos de un cu)o. •
;..1. (reación de Indicadores En este oento se crear$n dos indicadores *ue ser$n incluidos en el cu)o <(u)o de =entas<4 •
De la ta)la de +ec+os =ETAS<" se suari-ar$ el +ec+o (antidad< !ara crear el indicador denoinado4 •
o
6nidades =endidas<. o
La %órula utili-ada !ara crear este indicador es la siguiente4 o
6nidades =endidas< S6MB=ETAS.(antidad>. o
•
De la ta)la de +ec+os =ETAS<"se suari-ar$ el +ec+o MontoTotal< !ara crear el indicador denoinado4 •
o
Monto Total de =entas<. o
La %órula utili-ada !ara crear este indicador es la siguiente4 o
Monto Total de =entas< S6MB=ETAS.MontoTotal>. o
Entonces" el cu)o *uedaría con%orado de la siguiente anera4
Figura ;.814 (u)o ee!lo" !aso 1.
;..3. (reación de Atri)utos A+ora se crear$n # agregar$n al cu)o seis atri)utos4 •
De la ta)la de diensión (LIETE<" se toar$ el ca!o (liente< !ara la creación del atri)uto denoinado4 (lientes<. De la ta)la de diensión 59OD6(TO<" se toar$ el ca!o Marca< !ara la creación del atri)uto denoinado4 Marcas<.
De la ta)la de diensión 59OD6(TO<" se toar$ el ca!o 5roducto< !ara la creación del atri)uto denoinado4 5roductos<. De la ta)la de diensión FE(HA<" se toar$ el ca!o A2o< !ara la creación del atri)uto denoinado4 A2os<. De la ta)la de diensión FE(HA<" se toar$ el ca!o Triestre< !ara la creación del atri)uto denoinado4 •
Triestres<.
De la ta)la de diensión FE(HA<" se toar$ el ca!o Mes< !ara la creación del atri)uto denoinado4 Meses<. Entonces" el cu)o *uedaría con%orado de la siguiente anera4
Figura ;.834 (u)o ee!lo" !aso 3.
;..8. (reación de Perar*uías Finalente se crear$n # agregar$n al cu)o dos erar*uías4 •
Se de%inió la erar*uía Perar*uía 5roductos<" *ue se a!licar$ so)re los atri)utos recienteente creados" Marcas< # 5roductos<" en donde4 •
o
6n !roducto en es!ecial !ertenece solo a una arca. 6na arca !uede tener uno o $s !roductos. o
Gr$%icaente4
Figura ;.884 59OD6(TO<" relación !adreN+o.
Se de%inió la erar*uía Perar*uía Fec+as<" *ue se a!licar$ so)re los atri)utos recienteente creados" A2os<" Triestres< # Meses<" en donde4 o
6n es del a2o !ertenece solo a un triestre del a2o. 6n triestre del a2o tiene uno o $s eses del a2o. o
o
6n triestre del a2o !ertenece solo a un a2o. 6n a2o tiene uno o $s triestres del a2o. o
Gr$%icaente4
Figura ;.8:4 FE(HA<" relación !adreN+o.
Entonces" el cu)o *uedaría con%orado de la siguiente anera4
Figura ;.8;4 (u)o ee!lo" !aso 8.
;..:. Otros ee!los de cu)os ultidiensionales A !artir del odelo lógico !lanteado" !odrían +a)erse creado una gran cantidad de cu)os" cada uno de los cuales estaría orientado a un ti!o de an$lisis en !articular. Tal # coo se e'!licó antes" estos cu)os !ueden coe'istir sin ning7n incon&eniente. A continuación se e'!ondr$n una serie de cu)os de ee!lo4 •
(u)o 14 •
Figura ;.84 (u)o 1" ee!lo
•
(u)o 34 •