Accès obert Vols més informació?

Curs de Fonaments de Data Science

El curs de Fonaments de Data Science té una càrrega lectiva de 6 crèdits i una durada d'un semestre.

El programa s'estructura mitjançant una única assignatura:

  • Fonaments de data science (6 crèdits). Aquesta assignatura presenta els conceptes i la tipologia d'anàlisi de diferents tipus de dades, els models i els algorismes d'ús més freqüent de classificació i agrupació, així com les metodologies i els estàndards professionals i científics que s'utilitzen en l'anàlisi de negoci i la ciència de dades aplicada. L'estudiantat treballarà principalment amb R i RStudio, encara que poden fer-se activitats amb altres eines.

Per la seva banda, l'assignatura està constituïda mitjançant dos grans blocs:

Bloc 1. Metodologies i estàndards

  • Mòdul 1. S'analitza la mineria de dades (data mining) en un entorn informacional i es diferencia de l'existent en un entorn operacional, i s'introdueixen conceptes com el dels sistemes de suport a la decisió (DSS), els processos de l'entorn informacional i els d'extracció de coneixement, així com l'scoring d'un model de mineria de dades. Es presenten també els serveis de mineria de dades dins de l'estructura tecnològica i els escenaris per al desplegament de models posant l'accent en les solucions tecnològiques tant d'entorns de modelització integrats workbench com de serveis vinculats al gestor de la base de dades.
  • Mòdul 2. Està dedicat a la metodologia CRISP-DM, en què es defineixen conceptes rellevants com el de qualitat total o el de part implicada (stakeholder) i s'estudia l'adequació de la metodologia al projecte. En una primera etapa es realitza una comprensió del negoci tenint en compte els objectius del negoci i de la mineria de dades d'acord amb l'avaluació de la situació actual per realitzar un pla de projecte. Posteriorment s'efectua una comprensió de les dades (es capturen, es descriuen, s'exploren, se'n realitzen verificacions i se'n gestiona la qualitat) per preparar-los (se seleccionen, es realitza una neteja d'aquests i es construeix així el joc de dades, integrant-les i formatant-les) amb la finalitat de realitzar un modelatge amb aquestes. Se selecciona una tècnica específica i es marca una estratègia de verificació de la qualitat d'un model que es construeix i s'ajusta per avaluar aquest model, tenint en compte tant la revisió del procés com els següents passos a seguir. El procés culmina amb un desplegament que inclou un pla d'entrada en el procés productiu, un seguiment i manteniment, un informe final que permeti una revisió del projecte i la possibilitat d'obtenir objeccions a la metodologia.
  • Mòdul 3. S'estudia el model DELTA per a la millora contínua de l'anàlisi de negoci (business analytics) i se'n defineixen tots els possibles estats. No es consideren l'anàlisi, l'activitat analítica aïllada, l'aspirant analític, l'organització analítica ni el competidor analític.
  • Mòdul 4. Presenta l'estàndard PMML, la seva cobertura i el seu esquema: capçalera, diccionari de dades, esquema del model, agrupacions, associacions, transformacions, estadístiques, taxonomia i jerarquies i, finalment, output.
  • Mòdul 5. Es treballa el govern de serveis IT; es realitzen diverses definicions bàsiques de servei, sistema d'informació, procés, grups de procés i procediment, i s'aborden diferents processos: cicle PDCA (pla, do, check, act), processos de provisió de serveis, de relació, de resolució, de control i de lliurament.
  • Mòdul 6. Serà de gran ajuda als estudiants de l'especialitat, ja que es fa una excel·lent introducció al llenguatge R. Es defineix el projecte R i es mostra com baixar i instal·lar R incloent-hi algunes convencions, la interfície RStudio, com instal·lar un paquet nou i les opcions d'ajuda. A més, s'inclou tot un apartat dedicat als comandaments bàsics d'R: les funcions d'accés a ajuda, les utilitzades per gestionar l'entorn de treball, les de selecció de dades i les d'agregació. També s'incideix en altres aspectes com les entrades i sortides d'R, com treballar amb dades i els tipus de dades. El mòdul acaba amb alguns exemples de jocs de dades per al contracte de subministrament de combustibles, la segmentació de clients, l'estudi d'acceptació de producte i la classificació de clients.

Bloc 2. Materials específics de l'assignatura de Fonaments de data science.

  • Mòdul 1. Versa sobre l'anàlisi de negoci i aborda temes que van des de les definicions bàsiques d'anàlisi de negoci (business analytics) i el seu encaix en la història fins a les seves principals aplicacions o dominis d'aplicació, com la mineria de text (text mining), la mineria d'opinió (opinion mining), l'anàlisi de dades de xarxes socials (social network analysis) i la gestió de la reputació (reputation management). En aquest mòdul es mostra com fer una construcció d'una matriu de termes amb R.
  • Mòdul 2. Presenta alguns conceptes previs necessaris per poder comprendre millor els models i els algorismes, com els conceptes de distància i de similitud, i com utilitzar R per calcular la distància de Mahalanobis i detectar valors aberrants (outliers). El mòdul finalitza aprofundint en el tema del guany d'informació, matisant la utilitat d'R per a aquesta finalitat.
  • Mòdul 3. S'aborden alguns dels models i algorismes més rellevants. Es comença mostrant la taxonomia dels algorismes, es continua amb una descripció de l'aprenentatge supervisat i no supervisat i es finalitza amb els models d'associacions. En concret, s'aprofundeix en els models i algorismes següents:
    • Aprenentatge supervisat
      • Algorisme K-NN
      • Arbres de decisió
    • Aprenentatge no supervisat
      • Clustering dendrogrames
      • Clustering particional: algorisme k-mitjanes (k-means)
      • Canopy clustering
    • Associacions
      • Esperanza i suport
      • Algorisme MS-Apriori
Recursos per a l'aprenentatge

L'origen d'aquests recursos d'aprenentatge és múltiple. Es tracta tant de materials didàctics preparats per l'equip d'experts per a la seva activitat docent com de recursos externs.

Les eines de programari que s'utilitzaran en el curs de Fonaments de Data Science són R i RStudio. Aquesta descripció pot canviar en cada convocatòria en funció de les necessitats docents, l'actualització del programa i la relació amb els fabricants.

Es recomana disposar de màquines i SO de 64 bits i 4 GB de RAM mínim (8 GB recomanats).

Durada

A la UOC, un crèdit ECTS equival a 25 hores de treball de l'estudiant.

Segons el nombre de crèdits ECTS, la durada dels programes de postgrau oscil·la entre 1 mes i 2 anys, aproximadament:

  • Màster propi: 2 anys
  • Diploma de postgrau: 1 any
  • Especialització: 1 semestre (6 mesos) 
  • Curs: entre 1 i 6 mesos

 

Matrícula oberta

10% dte. matrícula anticipada


Fracciona en quotes el pagament del teu màster, postgrau o especialització

Matricula't
Consulta el procés de matrícula
Vols més informació?

Envia les teves dades i rebràs informació d'aquest programa i relativa a productes, serveis i activitats promocionals de la UOC

Introdueix un número de 9 dígits.
Introdueix un número de 9 dígits.
i_fix
Pref. Int.
Introdueix un número de 9 dígits.
i_fix
Pref. Int.
Introdueix un número de 9 dígits.

 

La UOC, segona millor universitat d'Espanya  segons el Young University Rankings del Times Higher Education

 


Matrícula anticipada


10% de descompte si et matricules fins al 6 de juliol inclòs

Pots fraccionar en quotes el pagament del teu màster, postgrau o especialització.

Informa-te'n

Per què escollir la UOC?

Reinventant la universitat

El model educatiu de la UOC

Sessió informativa. Màster d'Intel·ligència de Negoci i Big Data Analytics

Sessió online:
13 de setembre, 17.00 h



Informació i inscripcions

El moment de ser #eltuquevolsser és SEMPRE

Vols més informació?

Envia les teves dades i rebràs informació d'aquest programa i relativa a productes, serveis i activitats promocionals de la UOC

Introdueix un número de 9 dígits.
Introdueix un número de 9 dígits.
i_fix
Pref. Int.
Introdueix un número de 9 dígits.
i_fix
Pref. Int.
Introdueix un número de 9 dígits.