Todo lo que propone mi plataforma de contenidos online me parece un rollo. El reto de la diversidad en los algoritmos de recomendación

Todo lo que propone mi plataforma de contenidos online me parece un rollo.

El reto de la diversidad en los algoritmos de recomendación

Voy a la frutería dos veces por semana, y el frutero siempre me sorprende con alguna novedad. Desde hace tres años, cada noche, tengo un encuentro íntimo con mi plataforma de contenidos, y todavía no sabe lo que me gusta. Frutero 1, algoritmo de recomendación 0.

Desde 2017 estoy suscrito a una popular plataforma para ver series y películas. Sí, esa. Pero tengo un problema: de un tiempo a esta parte, tengo la sensación de que la aplicación me propone lo mismo una y otra vez. Me aburre. He de bucear a lo más profundo de cada sección hasta identificar por mí mismo algo que me apetezca ver. ¿Qué está pasando? ¿Es tan difícil proponerme algo que mole de un catálogo de 2.359 películas y 1.163 series?

En la últimas dos décadas, con el auge de Amazon, Netflix, YouTube y otros servicios web de contenidos y compras, los sistemas de recomendación han ido cobrando gran relevancia. Nos acompañan en nuestros recorridos por la red sugiriéndonos qué comprar, qué ver, o mostrándonos publicidad ajustada a nuestros intereses. Estos sistemas alimentan también aplicaciones profesionales como las herramientas de soporte a los agentes de venta telefónica o los portales de comercio electrónico B2B.

El desarrollo de sistemas de recomendación comenzó en la década de 1980, y ha sido un campo de intensa investigación desde entonces. En pocas palabras, un sistema de recomendación es un algoritmo de machine learning concebido para sugerirte un elemento específico o una configuración concreta dentro de un conjunto de opciones. El algoritmo formula su recomendación con el objetivo de ajustarse a tus intereses o necesidades.

 

Buscando la causa raíz

Un problema que suele darse en el entrenamiento de algoritmos de recomendación (y en algoritmos de machine learning en general) es el sobreajuste u over-fitting. El sobreajuste es el efecto de entrenar un algoritmo de aprendizaje con un exceso de datos que adolecen de cierto sesgo del que podemos no ser conscientes. Cuando esto sucede, el algoritmo queda ajustado a unas características muy específicas de los datos de entrenamiento que no tienen relación causal con la función objetivo, perdiendo la capacidad de resolver situaciones distintas a las no estrictamente entrenadas. Así, el algoritmo incrementa progresivamente su éxito respondiendo a las muestras de entrenamiento, y empeora su capacidad de manejar muestras nuevas. Algoritmos de recomendación contaminados por un problema de sobreajuste, ofrecerán resultados limitados y repetitivos, perdiendo la capacidad de sorprender y empeorando tu experiencia como usuario.

En el arranque del siglo XXI se introdujo el concepto de diversidad en el proceso de recomendación. En este contexto, la diversidad hace referencia a la presencia de elementos variados, diferentes o no semejantes en el resultado de la recomendación. La diversidad es un elemento interesante, porque puede resolver el problema del sobreajuste y aumenta la calidad de tu experiencia de usuario.

Así, en un sistema de recomendación de películas, la diversidad se hace presente cuando, una vez vista Star Wars IV, el sistema no se limita a recomendarnos los episodios V y VI, sino que nos hace sugerencias como, por ejemplo, Star Trek o Indiana Jones. Este ejemplo, sin embargo, pone de relieve el principal problema de la diversidad: que su percepción es subjetiva. Hay quien dirá que Star Wars y Star Trek son películas de ciencia-ficción similares, y que existe poca diversidad entre ambas; otros usuarios, en cambio, las percibirán como obras no semejantes en absoluto.

 

¿Tú qué percibes?

Desde que Bradley y Smith comenzaron a discutir el concepto en 2001, la comunidad científica está de acuerdo en que la diversidad es importante y debe ser medida. Pero no existe un consenso acerca de la definición matemática del término y la métrica a emplear para su dimensionado. Sin este consenso, es difícil cuantificar y comparar los resultados de los algoritmos que van surgiendo. Un resultado notable sobre el que sí hay acuerdo es que el aumento de la diversidad no significa necesariamente que se sacrifique la precisión en la recomendación, sino todo lo contrario: el uso de un enfoque adecuado puede dar lugar a un aumento de ambas.

¿Están los algoritmos de recomendación aumentando la diversidad que percibes? Los análisis de Vivian Zheng o Matevz Kunaver y Tomaz Pozrl sostienen que los sistemas de recomendación aumentan la diversidad individual, pero disminuyen la diversidad agregada; es decir, individualmente, recibes un conjunto de recomendaciones amplio y diverso, pero a todos nos están recomendando esencialmente lo mismo.

Tal vez la cuestión de fondo sea que no todos los usuarios tenemos las mismas preferencias en lo que a diversidad se refiere. La inmensa mayoría de algoritmos presuponen qué importancia le das a la diversidad y de qué manera lo haces. El combate entre familiaridad contra diversidad suele resolverse asumiendo que tú solo valoras la diversidad cuando se te ofrece un resultado relevante. Sin embargo, esta conjetura no resuelve el problema, únicamente desplaza el foco, pues ¿cómo definimos qué es relevante para ti?

Para terminar de rizar el rizo, ya en 2011 Hu y Pu demostraron empíricamente que el diseño de la interfaz de usuario tiene una influencia crítica en la diversidad percibida.

 

En conclusión…

Tengo la impresión de que el abordaje que desde la comunidad técnica y científica se le está dando a esta cuestión adolece de transdisciplinariedad y, en ocasiones, de rigor estadístico. En mi revisión de la literatura he notado una alarmante ausencia de psicólogos en los equipos de investigación que desarrollan los algoritmos. Y no, veinte alumnos de la universidad que financia el estudio no son una población representativa para realizar una prueba de validación. Queda mucho trabajo por hacer, ¿te apuntas?

 

Para saber más

Un completísimo artículo de Baptiste Rocca repasando el funcionamiento de los algoritmos de recomendación más populares está disponible de forma gratuita en https://towardsdatascience.com/introduction-to-recommender-systems-6c66cf15ada

Si dispones de poco tiempo y solo buscas un primer acercamiento a la materia, es muy útil el artículo de Kumar y Reddy “A survey on Recommender Systems (RSS) and its applications”, publicado en el International Journal of Innovative Research in Computer and Communication Engineering, vol. 2, núm. 8, agosto 2014. Disponible en línea en http://www.ijircce.com/upload/2014/august/5_ASurvey.pdf

75 referencias de algoritmos de diversidad son analizadas desde varias perspectivas en el trabajo de Kunaver y Požrl “Diversity in recommender systems – A survey”, publicado en la revista Knowledge-Based Systems, núm. 123, págs. 154–162, 2017. Disponible en
https://papers-gamma.link/static/memory/pdfs/153-Kunaver_Diversity_in_Recommender_Systems_2017.pdf

Cito a Vivian Zheng en relación con su artículo “Frontiers of Recommendation Systems & Diversity”, disponible en https://papers-gamma.link/static/memory/pdfs/153-Kunaver_Diversity_in_Recommender_Systems_2017.pdf

El estudio de Hu y Pu sobre la influencia de la interfaz de usuario en la percepción de la diversidad se ha publicado bajo el título “Helping users perceive recommendation diversity” en Proceedings of the Workshop on Novelty and Diversity in Recommender Systems (DiveRS 2011), págs. 43-55. Chicago, Illinois, EE.UU., 2011.

 

 

Victor Pérez, Gerente de Innovación. MIA Advanced Systems.

 

Disfrutamos construyendo experiencias.

ESPAÑA

PORTUGAL

ESTADOS UNIDOS