Una nueva figura que emerge con fuerza
¿Hasta dónde pueden llegar los Data Scientists?
Convertir el plomo en oro, el carbón en diamante, o encontrar la luz entre las tinieblas ya no es solo tarea de alquimistas o magos.
Lo imposible se ha convertido en posible gracias a la ciencia moderna, y solo el ‘business case’ de cada operación determina si es viable llevarlo a cabo o no.
Por otro lado, en la época victoriana el detective de ficción Sherlock Holmes, su inestimable colaborador el doctor Watson o su sempiterno alter ego Moriarty hicieron las delicias de generaciones, en un anticipo de la criminología y de las series tipo CSI (investigación en la escena del crimen).
En el mundo de la tecnología de la información, se ha identificado una nueva figura llamada data scientist, en español científico del dato, que al igual que Sherlock Holmes y Watson o que los actuales detectives intentan obtener la máxima información a partir de un conjunto de datos lo más amplio posible que van recopilando y cotejando.
La nueva figura de data scientist, como Holmes y Watson en las novelas, obtienen la máxima información a partir de un conjunto de datos más amplio. Share on XEl paralelismo con las herramientas actuales que utilizan estos data scientists se establece también por cómo han sido bautizadas. Así, IBM eligió el nombre de Watson para su herramienta de sistema de conocimiento y siguiendo ese juego, nuestro partner ITAInnova eligió Moriarty. En Inycom a nuestro framework de gestión del conocimiento lo hemos llamado Magician.
Entre las tareas que realizan estos data scientists utilizando estas herramientas está la homogenización de la información de muy distintas fuentes, la eliminación de ruido mediante filtros, la discretización de datos continuos para su mejor estudio, la clasificación de la información en grupos predefinidos en diccionarios o mediante técnicas de agrupación dinámica (clustering), la utilización de sistemas expertos para mejorar resultados, las búsquedas de bases de datos externas que aporten valor a los datos en su contexto y en general la búsqueda de la correlación entre datos de distintos orígenes para poder inferir conclusiones.
Más sobre Big Data en Inycom TV
CÓMO ACERCAR EL BIG DATA A LAS EMPRESAS |
Para el ámbito concreto del lenguaje natural (semántica) las tareas incluyen acciones adicionales como la detección de idiomas, el análisis de sentimiento del texto, la determinación de la función lingüística de las palabras, la identificación de sujetos (personas, lugares y cosas) y la agrupación de sinónimos entre otros.
Igualmente el almacenamiento conveniente de la información a través de arquitecturas específicas como Hadoop, nuevos tipos de bases de datos NoSQL para Big Data y las bases de datos de grafos para la identificación y mantenimiento de relaciones entre las entidades, contribuye enormemente a trabajar convenientemente con esta gran cantidad de información.
Por último la representación visual de los datos a través de la creación de modelos sencillos y de unas potentes herramientas gráficas dinámicas que permiten visualizar y manipular los filtros de información por parte del usuario familiarizado con el lenguaje del negocio facilita enormemente la comprensión de los resultados.
Inycom en esa línea dispone de una de las herramientas más potentes del mercado, Tableau. Nuestro equipo no sólo aconseja sobre el uso de la herramienta si no que sobre todo facilita la integración entre los distintos sistemas del negocio para obtener el mayor partido para su empresa o institución.
¡Tu opinión es vital!
Mejorando juntos
Social Links: