Cada empresa és un tresor, sobretot quan es tracta de les seves dades. A mesura que la tecnologia moderna ha permès la creació i l’emmagatzematge de quantitats cada vegada majors d’informació, els volums de dades s’han disparat. En tan sols aquests dos últims anys, més del 90% de dades han estat creades. Un tresor, cert?, depèn de si s’aprofiten i se saben gestionar.
La gran quantitat de dades que constantment es recopilen i s’emmagatzemen per mitjà de l’ús de la tecnologia pot aportar beneficis transformadors a les organitzacions i societats de tot el món, però només si podem interpretar-los. És aquí on entra Data Science.
Què és Data Science?
Data Science o Ciència de Dades, es refereix a l’extracció d’informació processable a partir de dades sense processar. Aquesta disciplina combina múltiples camps que inclouen estadística, mètodes científics i anàlisis de dades per a extreure conclusions (insights) de valor. Els científics de dades combinen una gran varietat d’habilitats per analitzar dades recopilades de la web, telèfons intel·ligents, clients, sensors i altres fonts.
La Ciència de Dades revela tendències i genera intel·ligència que les empreses poden utilitzar per a prendre millors decisions, anticipar-se al canvi i per descomptat, generar productes i serveis més innovadors. Permet que els models de machine learning (ML) aprenguin a partir de grans quantitats de dades que se’ls subministra, en lloc de dependre d’analistes de negocis per a veure que poden descobrir a partir de la informació que poden absorbir.
Un científic de dades (Data Scientist) no sols realitza l’anàlisi exploratòria per a descobrir informació, també utilitza algorismes avançats de ML per a identificar un esdeveniment particular en el futur. Per tant, la ciència de dades s’usa principalment per a prendre decisions i prediccions fent ús d’anàlisi causal predictiva, anàlisi prescriptiva i aprenentatge automàtic.
- Anàlisi causal predictiva: model que s’utilitza per a predir les possibilitats d’un esdeveniment particular en el futur. Aquest model és utilitzat, per exemple, en els bancs, on per mitjà d’aquest model poden predir d’acord amb l’historial del client si els pagaments arribaran a temps o no, per tant, si està subjecte a crèdit.
- Anàlisi prescriptiva: Model que té intel·ligència per a prendre decisions pròpies i amb la capacitat de modificar-ho d’acord amb paràmetres dinàmics. No sols prediu, també suggereix una varietat d’accions prescrites i resultats associats. Aquest tipus d’anàlisi és part fonamental del desenvolupament de cotxes autònoms. Les dades recopilades pels vehicles regulars es poden utilitzar per a entrenar vehicles autònoms. Aquesta informació permetrà que el vehicle pugui prendre decisions com quan girar, quin camí prendre, quan reduir, accelerar, etc.
>>>El futur del transport per carretera: camions sense conductor<<<
- Machine Learning per a fer prediccions: Si una companyia disposa de dades històriques, es pot entrenar en l’aprenentatge automàtic per a fer previsions. Per exemple, una empresa que té dades històriques de compres fraudulentes pot utilitzar-les com a base de dades que l’algorisme d’aprenentatge automàtic utilitza per a prevenir fraus. Aquest model també se’l coneix com a aprenentatge supervisat, perquè ja es tenen dades de base per a poder entrenar a les seves màquines i aquests poden ser utilitzats per a diferents objectius.
- Machine Learning per al descobriment de patrons: Si no es tenen paràmetres ni dades base per fer prediccions, s’utilitza el descobriment de patrons ocults dins del conjunt de dades per a poder fer prediccions significatives. Això és un model sense supervisió, on l’algorisme més comú utilitzat per al descobriment de patrons és el Clustering.
Com pot aplicar-se Data Science en diferents sectors? Aquí alguns exemples:
El sector de la salut, especialment, rep grans beneficis de les aplicacions de la Ciència de Dades.
Anàlisi d’imatges mèdiques:
Procediments com la detecció de tumors, l’estenosi de les artèries o la delimitació d’òrgans empra mètodes d’aprenentatge automàtic, màquines de vectors de suport (SVM), indexació d’imatges mèdiques basades en contingut i anàlisi d’ones per a la classificació de textures sòlides.
Google ha desenvolupat l’eina LYNA, que identifica tumors de càncer de mama que fan metàstasi en els ganglis limfàtics pròxims. En l’assaig Lymph Node Assistant, va identificar amb precisió el càncer metastàtic el 99% de les vegades utilitzant el seu algorisme d’aprenentatge automàtic.
https://ai.googleblog.com/2018/10/applying-deep-learning-to-metastatic.html
Desenvolupament de fàrmacs:
El procés de descobriment de fàrmacs és molt complicat i involucra moltes disciplines. Les millors idees sovint estan limitades per milers de milions de proves, una gran inversió financera i de temps. De mitjana, es necessiten dotze anys per a realitzar una presentació oficial.
Les aplicacions de ciència de dades i els algorismes d’aprenentatge automàtic simplifiquen i escurcen aquest procés. La idea darrere del descobriment de fàrmacs computacionals és crear simulacions de models informàtics com una xarxa biològicament rellevant que simplifica la predicció de resultats futurs amb alta precisió.
Assistència virtual per a pacients i atenció al client:
L’optimització del procés clínic es basa en el concepte que en molts casos no és realment necessari que els pacients visitin al metge en persona. Una aplicació mòbil pot oferir una solució més eficaç sense sortir de casa.
Les aplicacions mòbils impulsades per IA poden proporcionar assistència sanitària bàsica, normalment com chatbots. Simplement es descriuen els símptomes o es realitzen preguntes per a rebre informació clau sobre la condició mèdica, vinculant els símptomes amb les causes dins d’una àmplia xarxa d’informació disponible. També poden recordar al pacient prendre el medicament i, si és necessari, assignar-li una cita amb un metge.
L’impacte en la logística, el transport i el last mile delivery.
L’avenç més significatiu o l’evolució que ens ha donat la ciència de dades en el camp del transport és la introducció d’automòbils autònoms. És una aposta per proporcionar entorns de conducció més segurs, optimitzar el rendiment del vehicle, agregar autonomia al conductor i molt més. Mitjançant ML i la introducció a l’autonomia, els fabricants de vehicles són capaços de crear automòbils intel·ligents i millors rutes logístiques.
UPS: Optimitzant l’encaminament de paquets
UPS utilitza la ciència de dades per a optimitzar el transport de paquets. Network Planning Tools (NPT), és una plataforma que incorpora aprenentatge automàtic i intel·ligència artificial per a resoldre reptes logístics, com el canvi de ruta per a evitar el mal temps o els colls d’ampolla en el servei. NPT permet als enginyers simular una varietat de solucions i triar les millors. La IA també té el poder de suggerir rutes per si mateixa.
https://www.technologyreview.es/s/10759/asi-ayuda-una-ia-ups-en-el-reparto-de-regalos-navidenos
UBER EATS: Lliurament a domicili
Els científics de dades d’Uber Eats, tenen un objectiu bastant simple: lliurar menjar calent ràpidament. Tanmateix, fer que això succeeixi requereix aprenentatge automàtic, modelatge estadístic avançat i meteoròlegs en plantilla. Per a optimitzar el procés de lliurament complet, l’equip ha de predir com cada variable és possible, des de tempestes fins a presses nadalenques, el trànsit i el temps de cocció.
El valor empresarial de la ciència de les dades depèn de les necessitats de cada organització. Data Science pot ajudar a crear les eines per a tota mena d’objectius des de fer tasques de forma més automatitzada, preveure fallades, fins a donar-nos suport a crear estratègies, productes i serveis que aportin valor al consumidor de manera constant i adaptable a les seves necessitats al llarg del temps.
Aquesta tecnologia està ja en moviment, i les nostres dades poden ser el major actiu de l’empresa. Per la qual cosa és important realment considerar-la dins del procés de Transformació Digital del nostre negoci.