Es una forma de inteligencia artificial (AI) que hace posible que un sistema aprenda de los datos de forma iterativa mediante el uso de diferentes algoritmos para describirlos y predecir resultados gracias al aprendizaje de los datos de entrenamiento que produce modelos precisos.
El hecho de tener equipos que sepan qué hacer sin que nadie se lo diga explícitamente es algo que ha ocupado la imaginación de las personas durante mucho tiempo.
La idea de un coche en el que pueda montarse (en el asiento del conductor, por supuesto) y que se ocupe de toda la conducción, que identifique a los peatones y a los baches, y que responda de forma rápida y eficiente a los cambios en el entorno para llevarlo de forma segura a su destino sería una forma de machine learning (ML) puesta en práctica.
¿Cómo funciona? Vamos a comenzar analizando solamente los datos empresariales.
El ML es un tipo de IA que permite que las empresas aprendan de cantidades masivas de datos y les den sentido. Pongamos como ejemplo a Twitter. Según Internet Live Stats, los usuarios de Twitter envían aproximadamente 500 millones de tweets a diario, lo que equivale a un total de aproximadamente 200 mil millones de tweets al año. No es humanamente posible analizar, clasificar, ordenar, descubrir y predecir nada con ese número de tweets.
El machine learning requiere una considerable carga de trabajo por parte de las empresas para que estas obtengan información valiosa. Para sacar el máximo provecho al ML debe tener datos limpios y tener claro qué desea saber sobre ellos. Después podrá seleccionar el modelo y algoritmo que más beneficien a su empresa. El ML no es un proceso simple ni sencillo. Para que tenga éxito es necesario un trabajo diligente.
El ML tiene un ciclo de vida:
El machine learning es una forma de que las empresas comprendan sus datos y aprendan de ellos. Una empresa puede utilizarlo para un gran número de subcampos. El caso de uso depende de si una empresa está intentando mejorar las ventas, proporcionar una característica de búsqueda, integrar comandos de voz en su producto o crear un vehículo autónomo.
El ML tiene una fantástica variedad de usos en las empresas de hoy en día y con el tiempo solo puede aumentar y mejorar. Los subcampos del ML incluyen recomendaciones de productos y redes sociales, reconocimiento de imagen, diagnóstico de salud, traducción de idiomas, reconocimiento de voz y minería de datos, por mencionar algunos.
Las plataformas de redes sociales como Facebook, Instagram o LinkedIn utilizan el ML para sugerir qué páginas seguir o a qué grupos unirse según las publicaciones que le hayan gustado. Hacen falta datos históricos sobre lo que les ha gustado a los demás o qué publicaciones son similares a aquellas que le han gustado a usted para realizar esas sugerencias o para añadirlas a su actividad.
También es posible utilizar el ML en un sitio de e-commerce para realizar recomendaciones según adquisiciones anteriores, sus búsquedas y las acciones de otros usuarios similares a usted.
Un uso importante del ML hoy en día es el reconocimiento de imagen. Las plataformas de las redes sociales han recomendado etiquetar a las personas en sus fotos con base en el ML. La policía ha podido utilizarla para buscar a sospechosos en fotografías o en vídeos. Debido a la gran cantidad de cámaras instaladas en los aeropuertos, tiendas y portales, es posible averiguar quién ha cometido un crimen o a dónde ha ido el criminal.
Los diagnósticos de salud también son un buen uso del ML. Después de un suceso como un ataque al corazón, es posible retroceder y ver señales de alarma que se pasaron por alto. Un sistema utilizado por médicos u hospitales podría ser utilizar historias clínicas del pasado y aprender a ver las conexiones desde el inicio (comportamiento, resultado de pruebas o síntomas) hasta el resultado (p. ej.: un ataque al corazón). A continuación, cuando el médico introduzca sus notas y los resultados de las pruebas en el sistema en el futuro, la máquina podrá detectar síntomas de un ataque al corazón de una forma mucho más fiable que los humanos para que así tanto paciente como médico puedan realizar cambios y evitarlo.
La traducción de idiomas en las páginas web o en las aplicaciones para plataformas móviles es otro ejemplo de ML. Algunas aplicaciones lo hacen mejor que otras, lo cual tiene que ver con los algoritmos, la técnica y el modelo de ML que utilizan.
Un uso diario del ML hoy en día se puede ver en las operaciones bancarias y en las tarjetas de crédito. Hay signos de fraude que el ML puede detectar rápidamente y que a los humanos les costaría un largo tiempo descubrir, si es que llegan a hacerlo. La gran cantidad de transacciones que se han examinado y catalogado (siendo fraude o no) puede permitir al ML detectar un fraude en el futuro en una sola transacción. La minería de datos es un ML fantástico para hacer esto.
Minería de datos
La minería de datos es un tipo de ML que analiza los datos para realizar predicciones o para descubrir patrones en grandes cantidades de datos. El término es un poco confuso ya que no es necesario que nadie, sea un agente malicioso o un empleado, rebusque entre sus datos para que encuentre algún dato que sea útil. En su lugar, el proceso hace que el descubrimiento de patrones sea útil para tomar decisiones en el futuro.
Pongamos, por ejemplo, una empresa de tarjetas de crédito. Si usted tiene una tarjeta de crédito, su banco seguramente le ha avisado de una actividad sospechosa con su tarjeta en alguna ocasión. ¿Cómo detecta el banco ese tipo de actividad tan rápido y envía una alerta prácticamente instantánea? Lo que permite esta protección frente al fraude es una minería de datos continua. A principios de 2020 había más de 1100 millones de tarjetas emitidas solamente en EE. UU. El número de transacciones desde esas tarjetas produce diferentes datos para la minería, búsqueda de patrones y el aprendizaje, y así identificar transacciones sospechosas en el futuro.
Aprendizaje profundo
El aprendizaje profundo es un tipo de ML específico que se basa en redes neuronales. Una red neuronal funciona para emular el funcionamiento de las neuronas en un cerebro humano y así tomar una decisión o entender algo. Por ejemplo, un niño de seis años puede mirar un rostro y distinguir entre su madre y el guardia de cruce porque el cerebro analiza muchos detalles rápidamente (color de pelo, rasgos faciales, cicatrices, etc.), todo en un solo pestañeo. El machine learning reproduce esto con el aprendizaje profundo.
Una red neuronal tiene entre 3 y 5 capas: una capa de entrada, entre una y tres capas ocultas, y una capa de salida. Las capas ocultas toman las decisiones una por una para trabajar hacia la capa de salida o la conclusión. ¿Qué color de pelo? ¿Qué color de ojos? ¿Hay alguna cicatriz? Como las capas aumentan hasta ser cientos de ellas, se llama aprendizaje profundo.
Hay 4 tipos principales de algoritmos de machine learning: supervisado, semisupervisado, no supervisado y de refuerzo. Los expertos en ML creen que aproximadamente un 70 % de los algoritmos de ML que se utilizan hoy en día son supervisados. Trabajan con conjuntos de datos catalogados o conocidos (por ejemplo, fotografías de perros y gatos). Estos dos tipos de animales son conocidos, así que los administradores pueden catalogar las fotografías antes de dárselas al algoritmo.
Los algoritmos de ML no supervisado aprenden de conjuntos de datos desconocidos. Por ejemplo, los vídeos de TikTok. Hay tanta cantidad de vídeos de tantos temas diferentes que es imposible entrenar a un algoritmo a partir de ellos de manera supervisada, los datos aún no se han catalogado.
Los algoritmos de ML semisupervisados se entrenan inicialmente con un pequeño conjunto de datos conocido y catalogado. A continuación, se aplica a un conjunto de datos más grande sin catalogar para continuar su entrenamiento.
Los algoritmos de ML de refuerzo no están entrenados inicialmente. Aprenden del ensayo y error sobre la marcha. Piense en un robot que está aprendiendo a hacerse camino sobre un montón de rocas. Cada vez que se cae aprende qué es lo que no funciona y cambia su comportamiento hasta tener éxito. Piense en el entrenamiento de un perro y en el uso de los premios para enseñar diferentes órdenes. Gracias a un refuerzo positivo el perro continuará obedeciendo las órdenes y cambiará aquel comportamiento que no le proporcione una respuesta favorable.
Machine learning supervisado
Utiliza conjuntos de datos clasificados, establecidos y conocidos para encontrar patrones. Ampliemos la idea anterior de las imágenes de perros y gatos. Usted podría tener un conjunto de datos gigante lleno de cientos de diferentes animales en millones de imágenes. Como conocemos los tipos de animales, estos se podrían haber agrupado y catalogado antes de proporcionárselos al algoritmo de ML supervisado para que este aprenda a comprender.
Ahora el algoritmo supervisado compara la entrada con la salida y la fotografía con la clasificación del tipo de animal. Con el tiempo aprenderá a reconocer un tipo concreto de animal en las fotografías nuevas que se encuentre.
Machine learning no supervisado
Los algoritmos de ML no supervisado son como los filtros de spam de hoy en día. Al principio los administradores podían programar los filtros de spam para que buscase palabras concretas en un email para comprender el spam. Esto ya no es posible, por lo que el algoritmo no supervisado funciona bien aquí. El algoritmo de ML no supervisado se compone de emails que no se han catalogado para empezar a buscar patrones. A medida que va encontrando esos patrones aprenderá cuál es el aspecto del spam y cómo identificarlo en el entorno de la producción.
Las técnicas de ML solucionan problemas. Dependiendo del problema al que se enfrente, elija una técnica de ML concreta. Aquí están las 6 más comunes.
La regresión se puede utilizar para predecir los precios de mercado de la vivienda o para determinar el mejor precio de venta de una pala para la nieve en Minnesota en diciembre. La regresión dice que, aunque los precios fluctúen, siempre regresarán a su precio medio, aunque con el tiempo los precios de las viviendas estén aumentando, hay una media que siempre volverá a suceder. Puede trazar los precios a lo largo del tiempo en un gráfico y encontrar la media a medida que pasa el tiempo. Si la línea roja sigue apareciendo en la gráfica, será posible hacer predicciones futuras.
La clasificación se utiliza para agrupar los datos en categorías conocidas. Puede estar buscando clientes que previsiblemente sean buenos clientes (siempre vuelven y se gastan más dinero) o que previsiblemente vayan a empezar a comprar en otro sitio. Si puede mirar atrás en el tiempo y encontrar indicadores para cada clasificación de clientes, los aplicará a clientes actuales y predecirá en qué grupo encajarán. Entonces será capaz de promocionarse de forma más efectiva y posiblemente convertir a los clientes potenciales que podrían irse en unos clientes geniales que vuelven. Este es un buen ejemplo de un ML supervisado.
A diferencia de la técnica de clasificación, la agrupación es un ML no supervisado. En la agrupación, el sistema encontrará la forma de agrupar los datos que usted no sabe cómo agrupar. Este tipo de ML es excelente para analizar imágenes médicas, para analizar redes sociales o para buscar anomalías.
Google utiliza la agrupación para la generalización, la compresión de datos y la preservación de la privacidad en productos como los vídeos de YouTube, las aplicaciones de Play y las pistas de Music.
La detección de anomalías se utiliza cuando está buscando valores atípicos, como detectar la oveja negra en un rebaño. Cuando buscamos en una cantidad masiva de datos, es imposible que un humano encuentre este tipo de anomalías. Pero, por ejemplo, si un científico de datos alimentó los datos de un sistema de facturación médica de diferentes hospitales, la detección de anomalías encontraría una forma de agrupar la facturación. Podría descubrir un conjunto de valores atípicos que resulten ser donde ocurren los fraudes.
La lógica de los análisis de la cesta de la compra permite predicciones futuras. Un ejemplo sencillo: si los clientes añaden carne picada, tomates y tacos a su cesta, usted podría predecir que añadirán queso y crema agria. Estas predicciones se pueden utilizar para generar ventas adicionales al realizar sugerencias valiosas para los compradores online sobre los productos que podrían haber olvidado o para ayudar a agrupar los productos en una tienda.
Dos profesores del MIT utilizaron este enfoque para descubrir el «presagio del fallo». Al parecer, a algunos clientes les gustan los productos que fallan. Si puede detectarlos, puede determinar si continuar vendiéndole un producto y qué tipo de marketing aplicar para aumentar las ventas con los clientes adecuados.
Los datos de series temporales se suelen recopilar sobre muchos de nosotros gracias a los monitores de aptitud física de nuestras muñecas. Puede recopilar las pulsaciones por minuto, cuántos pasos damos por minuto u hora y algunos ahora incluso miden la saturación de oxígeno a lo largo del tiempo. Con estos datos podría ser posible predecir cuándo alguien va a ir a correr en el futuro. También sería posible recopilar datos sobre maquinaria y predecir el fallo debido a los datos con base en el tiempo sobre el nivel de vibración, el nivel de los decibelios de ruido y la presión.
Si se supone que el ML aprende de los datos, ¿cómo diseña un algoritmo para aprender y encontrar los datos estadísticamente importantes? Los algoritmos de ML admiten el proceso del ML de refuerzo, no supervisado o supervisado.
Los ingenieros de datos escriben fragmentos de código que son algoritmos que permiten que un equipo aprenda o encuentre importancia en los datos
Vamos a ver algunos algoritmos concretos que son lo más comunes. Aquí tenemos los 5 mejores en uso hoy en día.
Tras combinar el tipo de ML (supervisado, no supervisado, etc.), las técnicas y los algoritmos, el resultado es un archivo que se ha entrenado. Ahora a este archivo se le puede proporcionar datos nuevos y será capaz de crear patrones de reconocimiento y realizar predicciones o tomar decisiones para la empresa, el director o el cliente a demanda.
Los lenguajes de machine learning son la forma en la que se escriben las instrucciones para que el sistema aprenda. Cada lenguaje tiene una comunidad de usuarios de soporte de los que aprender o para guiar a otros. Hay bibliotecas incluidas en cada lenguaje para el uso del machine learning.
Aquí están los 10 mejores según GitHub Encuesta de los 10 mejores en 2019.
Machine learning con Python
Como Python es el lenguaje de ML más común, aquí hablamos un poco más sobre él.
Python es un lenguaje orientado a objetos, de open source e interpretado que le debe su nombre a los Monty Python. Como es interpretado, se convierte a códigos de bytes antes de que sea ejecutable mediante una máquina virtual de Python.
Hay una variedad de características que hacen que Python sea la opción preferida para el ML.
Recursos
Desmitificar el machine learning
Las mejores 10 aplicaciones de machine learning de 2021
Curso intensivo de machine learning
Los mejores 10 algoritmos de machine learning que debería conocer en 2021
Regresión logística en R: El tutorial definitivo con ejemplos