|
Àrea
03
Mineria de
Dades
Descripció
de l’àrea
Les empreses tenen actualment
a la seva disposició sofisticades eines informàtiques amb
capacitat de ajudar-les a resoldre els principals problemes de gestió.
Aquests processos informàtics generen volums molt importants
de dades. Moltes d’aquestes dades s’han anat recollint des
dels inicis dels processos de mecanització de l’empresa,
sense un objectiu especial. Actualment, en un moment en què,
més que mai, cal buscar nous camins i eines per cercar avantatges
competitives respecte de la competència, convertir aquestes dades
en coneixement, pot ser clau.
D'altra banda tenim un problema
de volum de dades. Aquestes aplicacions i les noves lligades al món
d'internet, generen quantitats ingents de dades. Aquest volum precisa
noves metodologies i eines per enfrontar-s´hi mitjançant
eines d’anàlisi més o menys automàtiques.
El descobriment del coneixement en les bases de dades (en anglès,
Knowledge Discovery in Databases, KDD) és un dels camps que està
evolucionant més per tal d’oferir solucions a l’anàlisi automatitzada.
És una àrea que interacciona notablement amb altres aspectes de
la informàtica, les matemàtiques i l'estadística.
Els
aspectes del descobriment del coneixement en grans volums de dades que
s’estudien i treballen en aquesta àrea són:
- Aspectes tècnics per als processos previs en la cerca de coneixement:
preparació de dades i tasques prèvies a l’anàlisi:
- Diferents branques de la ciència que han desenvolupat metodologies
i eines útils directament per al nostre objectiu
- Aspectes tècnics per als processos en la cerca de coneixement
pròpiament dita:
- Diferents branques de la ciència que han desenvolupat metodologies
i algorismes útils directament per al nostre objectiu
- Estudi de les diferents metodologies i algorismes, rendiment i eficiència
- Aspectes tècnics per als processos en la qualitat del model obtingut
i l’avaluació dels resultats:
- Diferents branques de la ciència que han desenvolupat metodologies
i algorismes útils per aquest objectiu
- Aprenentatge amb les diferents eines de mercat adreçades a
solucionar aquests problemes
- Aspectes de la gestió del cicle de vida peculiar d’aquesta
mena de projectes informàtics
Temes que es poden treballar en aquesta àrea
A continuació
mostrem una petita llista de temes que es poden treballar en aquesta àrea.
Teniu en compte que hi ha molts altres temes que podrien ser-hi inclosos.
- Estudi en profunditat d’alguna metodologia o algorisme concret: rendiment,
eficiència, punts forts i febles, proposta de millores.
- Anàlisi sistematitzada del mercat de les eines adreçades als processos
de KDD.
- Anàlisi sistematitzada del mercat d’eines auxiliars que ens poden
ser útils: preparació de dades, anàlisi, etc.
- Estudi i/o previsió de possibles aportacions del KDD als diferents
àmbits del coneixement i de la indústria.
- Estudi de les metodologies i eines que poden donar suport al cicle
de vida d’aquests projectes.
- Implementació real, total o parcial d’un projecte de KDD.
- Estudi i propostes sobre les metodologies més adequades per a gestionar
tot el cicle de vida d’aquest tipus de projecte.
- Implantació
d'un projecte de Knowledge Center amb una eina comercial
- Implantació
d'un projecte de Mineria de Dades amb Arbres de Decisió
Coneixements necessaris per a treballar en aquesta àrea
Per
poder fer el TFC en aquesta àrea és necessari que l'estudiant hagi assimilat
correctament els coneixements impartits a l’assignatura Mineria de
Dades.
Són
recomanables els coneixements de les assignatures d’Estadística i Bases
de Dades
Bibliografia de l'àrea
Witten,
Ian H.
Data mining : practical machine learning tools and techniques with Java
implementations. Morgan Kaufmann, 2000
Fayyad, Usama; Grinstein,
Georges G.; Wierse, Andreas
Information visualization in data mining and knowledge discovery.
Morgan Kaufmann, 2001
Adriaans,
Pieter
Data mining. Addison-Wesley,
1996
KDnuggets
Data Mining, Web Mining, and Knowledge Discovery Guide
www.kdnuggets.com

|