Antes de hablar de los tipos de machine learning que existen queremos dar una pequeña introducción sobre qué es machine learning en general. Es una disciplina del campo de la Inteligencia Artificial que, a través de algoritmos y herramientas especializadas como nuestra herramienta especializada Alteryx dota a los ordenadores de la capacidad de identificar patrones en datos masivos y elaborar predicciones (análisis predictivo). Este aprendizaje permite a las computadoras realizar tareas específicas de forma autónoma, es decir, sin necesidad de ser programados.

Los tipos de implementación de Machine Learning pueden clasificarse en tres categorías diferentes:

Aprendizaje supervisado
Aprendizaje no supervisado
Aprendizaje de refuerzo según la naturaleza de los datos que recibe.

Aprendizaje Supervisado

En el aprendizaje supervisado, los algoritmos trabajan con datos “etiquetados” (labeled data), intentado encontrar una función que, dadas las variables de entrada (input data), les asigne la etiqueta de salida adecuada. El algoritmo se entrena con un “histórico” de datos y así “aprende” a asignar la etiqueta de salida adecuada a un nuevo valor, es decir, predice el valor de salida. (Simeone , 2018)

Por ejemplo, un detector de spam, analiza el histórico de mensajes, viendo qué función puede representar, según los parámetros de entrada que se definan (el remitente, si el destinatario es individual o parte de una lista, si el asunto contiene determinados términos etc), la asignación de la etiqueta “spam” o “no es spam”. Una vez definida esta función, al introducir un nuevo mensaje no etiquetado, el algoritmo es capaz de asignarle la etiqueta correcta.

El aprendizaje supervisado se suele usar en:

Problemas de clasificación (identificación de dígitos, diagnósticos, o detección de fraude de identidad).
Problemas de regresión (predicciones meteorológicas, de expectativa de vida, de crecimiento etc).
Estos dos tipos principales de aprendizaje supervisado, clasificación y regresión, se distinguen por el tipo de variable objetivo. En los casos de clasificación, es de tipo categórico, mientras que, en los casos de regresión, la variable objetivo es de tipo numérico.

Los algoritmos más habituales que aplican para el aprendizaje supervisado son:

Árboles de decisión.
Clasificación de Naïve Bayes.
Regresión por mínimos cuadrados.
Regresión Logística.
Support Vector Machines (SVM).
Métodos “Ensemble” (Conjuntos de clasificadores).

Aprendizaje no Supervisado

El aprendizaje no supervisado tiene lugar cuando no se dispone de datos “etiquetados” para el entrenamiento. Sólo conocemos los datos de entrada, pero no existen datos de salida que correspondan a un determinado input. Por tanto, sólo podemos describir la estructura de los datos, para intentar encontrar algún tipo de organización que simplifique el análisis. Por ello, tienen un carácter exploratorio.

Por ejemplo, las tareas de clustering, buscan agrupamientos basados en similitudes, pero nada garantiza que éstas tengan algún significado o utilidad. En ocasiones, al explorar los datos sin un objetivo definido, se pueden encontrar correlación de información concreta, pero poco práctica.

El aprendizaje no supervisado se suele usar en:

Problemas de clustering
Agrupamientos de co-ocurrencias
Perfilado o profiling.

Si embargo, los problemas que implican tareas de encontrar similitud, predicción de enlaces o reducción de datos, pueden ser supervisados o no.

Los tipos de algoritmo más habituales en aprendizaje no supervisado son:

1. Algoritmos de clustering
2. Análisis de componentes principales
3. Descomposición en valores singulares (singular value decomposition)
4. Análisis de componentes principales (Independent Component Analysis)

¿Entonces, qué es el aprendizaje por refuerzo?

No todos los algoritmos de Machine learning se pueden clasificar como algoritmos de aprendizaje supervisado o no supervisado. Hay una «tierra de nadie» que es donde encajan las técnicas de aprendizaje por refuerzo.

Este tipo aprendizaje se basa en mejorar la respuesta del modelo usando un proceso de retroalimentación. El algoritmo aprende observando el mundo que le rodea. Su información de entrada es el feedback o retroalimentación que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.

No es un tipo de aprendizaje supervisado, porque no se basa estrictamente en un conjunto de datos etiquetados, sino en la monitorización de la respuesta a las acciones tomadas. Tampoco es un aprendizaje no supervisado, ya que, cuando modelamos a nuestro »aprendiz» sabemos de antemano cuál es la recompensa esperada.

Algunos de los usos prácticos más habituales del aprendizaje automático.

Seguridad informática, diagnóstico de ataques, prevención de fraude online, detección de anomalías, etc.
Reconocimiento de imágenes o patrones (facial, dactilar, objetos, voz, etc)
Conducción autónoma, mediante algoritmos deep learning: identificación de imágenes en tiempo real, detección de obstáculos y señales de tráfico, prevención de accidentes…
Salud: evaluación automática de pruebas diagnósticas, robótica médica etc
Análisis de mercado de valores ( predicciones financieras, evolución de mercados etc)
Motores de recomendación

Es fundamental tener claro en todo momento los objetivos buscados por la empresa a la hora de utilizar estas técnicas, para poder plantear las preguntas adecuadas a las bases de datos. Y, por supuesto, trabajar siempre con datos de calidad.

Somos expertos implementando la tecnología Alteryx dentro de tu organización, ofrecemos una síntesis profunda de características, un método automatizado de ingeniería de datos que detecta características de alta calidad basándose en las bases de datos que tus propios procesos internos proporcionan.

Las nuevas características actualizadas que ofrecemos con nuestro servicio de machine learning se convierten en parte de los modelos candidatos explorados, incluidos algoritmos populares como xgBoost, LightGBM y ElasticNet (de los más utilizados en las industrias).

Al proporcionar un conjunto de algoritmos robustos, Alteryx Machine Learning te ayudará a crear modelos de manera eficiente. Así tu empresa o industria podrá puede comprender, explicar y utilizar para la toma de decisiones. El aprendizaje automático que proporcionamos mediante nuestro partner Alteryx hace que el aprendizaje automático sea intuitivo y explicable.

Contáctanos para obtener más información sobre la implementación de esta gran tecnología que está revolucionando las operaciones a nivel mundial, forma parte de la transformación digital y de la industria 4.0.

[hubspot portal=»14529679″ id=»b40f2a35-54d4-4138-8200-71be1bea5f80″ type=»form»]