TFC
 

Àrea 03

Mineria de Dades

 

Descripció de l’àrea

Les empreses tenen actualment a la seva disposició sofisticades eines informàtiques amb capacitat de ajudar-les a resoldre els principals problemes de gestió. Aquests processos informàtics generen volums molt importants de dades. Moltes d’aquestes dades s’han anat recollint des dels inicis dels processos de mecanització de l’empresa, sense un objectiu especial. Actualment, en un moment en què, més que mai, cal buscar nous camins i eines per cercar avantatges competitives respecte de la competència, convertir aquestes dades en coneixement, pot ser clau.

D'altra banda tenim un problema de volum de dades. Aquestes aplicacions i les noves lligades al món d'internet, generen quantitats ingents de dades. Aquest volum precisa noves metodologies i eines per enfrontar-s´hi mitjançant eines d’anàlisi més o menys automàtiques.

El descobriment del coneixement en les bases de dades (en anglès, Knowledge Discovery in Databases, KDD) és un dels camps que està  evolucionant més per tal d’oferir solucions a l’anàlisi automatitzada.

És una àrea que interacciona notablement amb altres aspectes de la informàtica, les matemàtiques i l'estadística.

Els aspectes del descobriment del coneixement en grans volums de dades que s’estudien i treballen en aquesta àrea són:

  • Aspectes tècnics per als processos previs en la cerca de coneixement: preparació de dades i tasques  prèvies a l’anàlisi:
    • Diferents branques de la ciència que han desenvolupat metodologies i eines útils directament per al nostre objectiu
  • Aspectes tècnics per als processos en la cerca de coneixement pròpiament dita:
    • Diferents branques de la ciència que han desenvolupat metodologies i algorismes útils directament per al nostre objectiu
    • Estudi de les diferents metodologies i algorismes, rendiment i eficiència
  • Aspectes tècnics per als processos en la qualitat del model obtingut i l’avaluació dels resultats:
    • Diferents branques de la ciència que han desenvolupat metodologies i algorismes útils per aquest objectiu
  • Aprenentatge amb les diferents eines de mercat adreçades a solucionar aquests problemes
  • Aspectes de la gestió del cicle de vida peculiar d’aquesta mena de projectes informàtics

 

Temes que es poden treballar en aquesta àrea

A continuació mostrem una petita llista de temes que es poden treballar en aquesta àrea. Teniu en compte que hi ha molts altres temes que podrien ser-hi inclosos.

  • Estudi en profunditat d’alguna metodologia o algorisme concret: rendiment, eficiència, punts forts i febles, proposta de millores.
  • Anàlisi sistematitzada del mercat de les eines adreçades als processos de KDD.
  • Anàlisi sistematitzada del mercat d’eines auxiliars que ens poden ser útils: preparació de dades, anàlisi, etc.
  • Estudi i/o previsió  de possibles aportacions del KDD als diferents àmbits del coneixement i de la indústria.
  • Estudi de les metodologies i eines que poden donar suport al cicle de vida d’aquests projectes.
  • Implementació real, total o parcial d’un projecte de KDD.
  • Estudi i propostes sobre les metodologies més adequades per a gestionar tot el cicle de vida d’aquest tipus de projecte.
  • Implantació d'un projecte de Knowledge Center amb una eina comercial
  • Implantació d'un projecte de Mineria de Dades amb Arbres de Decisió

 

Coneixements necessaris per a treballar en aquesta àrea

Per poder fer el TFC en aquesta àrea és necessari que l'estudiant hagi assimilat correctament els coneixements impartits a l’assignatura Mineria de Dades.

Són recomanables els coneixements de les assignatures d’Estadística i Bases de Dades

 

Bibliografia de l'àrea

Witten, Ian H.
Data mining : practical machine learning tools and techniques with Java implementations.
Morgan Kaufmann, 2000


Fayyad, Usama; Grinstein, Georges G.; Wierse, Andreas
Information visualization in data mining and knowledge discovery. Morgan Kaufmann, 2001

Adriaans, Pieter
Data mining. Addison-Wesley, 1996

KDnuggets Data Mining, Web Mining, and Knowledge Discovery Guide
www.kdnuggets.com