Deep Mind

Publicado por @jargente el March 7, 2020, 12:40 a.m.
- **Resumen:** Deep Mind es un grupo de investigación especializado en inteligencia artificial que abarca la mayoría de los campos punteros en avance tecnológico y científico. Reune un gran grupo de distintos especialistas entre los que se encuentran científicos, matemáticos, expertos en machine learning, biólogos… etc y su objetivo es el de promover avances en el estado del arte de la inteligencia artificial para mejorar la vida de las personas en general. Surgió en 2010 y entonces no estaba tan centrado en la inteligencia artificial como ahora, sin embargo, después de obtener grandes avances en este campo, sobretodo en el control automático de videojuegos como Alpha Star o Alpha Go, hicieron que el equipo se especializara más en machine learning y en lo que este tipo de técnicas pueden hacer para ayudar a la sociedad. Con ese objetivo, en 2014 unieron fuerzas con Google y desarrollaron, entre otros, sistemas de inteligencia artificial capaces de igualar a los mejores expertos en la detección de enfermedades oculares o de gestionar de forma eficiente la refrigeración de enormes centros de datos para ahorrar energía. - **Principal área de Deep learning en la que están enfocados:** Debido a la naturaleza multidisciplinar del equipo y al objetivo tan general con el que fué creado (ayudar al avance de la sociedad en materia científica), Es dificil identificar un único área de Machine Learning en el que estén enfocados. Sólo en este año 2020 tienen ya varias publicaciones entre papers, posts en blogs especializados,etc… de investigaciones en campos como: **Deep Learning:** > [Self-Distillation Amplifies Regularization in Hilbert Space][1] > > [MEMO: A Deep Network for Flexible Combination of Episodic Memories][2] **Reinforcemente Learning** > [Social Diversity and Social Preferences in Mixed-Motive Reinforcement > Learning][3] > > [Static and Dynamic Values of Computation in MCTS][4] **Unsupervised Learning** > [On Contrastive Learning for Likelihood-free Inference][5] > > [Causally Correct Partial Models for Reinforcement Learning][6] Además de otras disciplinas fuera del área de machine learning como neurociencia, robótica o seguridad. Pero sin duda alguna, las investigaciones de este grupo que más eco tuvieron en la opinión pública, fueron aquellas centradas en la creación sistemas que fueron capaces de ganar en videojuegos a jugadores expertos humanos. Entre ellos, los tres más famosos han sido: *Atari with deep reinforcement learning* (Aprendió a jugar a más de 48 juegos de Atari únicamente procesando los pixeles de la pantalla) *Alpha Go* (El primer sistema capaz de derrotar a un jugador de Go Profesional) *Alpha Star* (Ganó a dos de los mejores jugadores de StarCraft II en varias ocasiones consecutivas) - **Responsables del grupo:** **Demis Hassabis (Co-Founder & CEO)** Ha tenido una exitosa carrera en la universidad y en el desarrollo de videojuegos como por ejemplo la creación del famoso superventas Theme Park que desarrolló con solo 17 años. Se graduó por la universidad de Cambridge y posteriormente se doctoró en neurociencia cognitiva en la London Global University Es miembro de prestigiosas asociaciones científicas como la Royal society, Royal academy of engineering y la Royal society of arts. En 2017 fue incluido en la lista de las 100 personas más influyentes y en 2018 fue premiado con el premio CBE por servicios a la ciencia y tecnología. Sus publicaciones mas destacadas son: > [MEMO: A Deep Network for Flexible Combination of Episodic Memories][7] > [A distributional code for value in dopamine-based reinforcement learning][8] > > [AlphaFold: Improved protein structure prediction using potentials from deep learning][9] **Shane Legg (Co-Founder & Chief Scientist)** Conoció a Demis en la unidad computacional de neurociencia mientras estudiaban la organización algorítmica del cerebro y compartieron interés en la idea de poder usar inteligencia artificial como medio para ayudar a la sociedad. Lo que más adelante culminarían con la creación de DeepMind. Tiene un doctorado por IDSIA (Dalle Molle Institute for Artificial Intelligence Research) en donde fue supervisado por Marcus Hutter una reconocida autoridad en modelos teóricos de máquinas super inteligentes. Su tesis doctoral ganó en 2018 el premio de investigación del Canadian Singularity Institute Sus publicaciones mas destacadas son: > [The Incentives that Shape Behaviour][10] > [Modeling AGI Safety Frameworks with Causal Influence Diagrams][11] > [Meta-learning of Sequential Strategies][12] **Koray Kavukcuoglu (Vice President of Research)** Es uno de los mayores expertos en deep learning. Anteriormente fue el lider del grupo de deep learning donde realizó grandes avances en algoritmos como DQN, Impala o Wavenet que han sido utilizados en la creación de “Google assistant” entre otros. Tiene un master en ingeniería espacial y un doctorado en ciencias de la computación Sus publicaciones mas destacadas son: > [AlphaFold: Improved protein structure prediction using potentials from deep learning][13] > > [AlphaStar: Grandmaster level in StarCraft II using multi-agent > reinforcement learning][14] > > [Human-level performance in 3D multiplayer games with population-based > reinforcement learning][15] - **Valoración personal** Creo que se trata de un gran equipo con gente de primer nivel en cuanto al desarrollo tanto de sistemas de machine learning como de inteligencia artificial en general y que sus aportaciones en el terreno de la medicina y diagnóstico de enfermedades, entre otros, puede ser muy valioso en los años venideros para mejorar la calidad de vida de la gente, que al final en sus propias palabras es el objetivo que este grupo persigue. También considero positiva la reciente colaboración con Google ya que esto muy posiblemente permitiré llevar estos avances a la mayoría de la gente. [1]: https://deepmind.com/research/publications/Self-Distillation-Amplifies-Regularization-in-Hilbert-Space [2]: https://deepmind.com/research/publications/MEMO-A-Deep-Network-for-Flexible-Combination-of-Episodic-Memories [3]: https://deepmind.com/research/publications/Social-Diversity-and-Social-Preferences-in-Mixed-Motive-Reinforcement-Learning [4]: https://deepmind.com/research/publications/Static-and-Dynamic-Values-of-Computation-in-MCTS [5]: https://deepmind.com/research/publications/On-Contrastive-Learning-for-Likelihood-free-Inference [6]: https://deepmind.com/research/publications/Causally-Correct-Partial-Models-for-Reinforcement-Learning [7]: https://deepmind.com/research/publications/MEMO-A-Deep-Network-for-Flexible-Combination-of-Episodic-Memories [8]: https://deepmind.com/research/publications/A-distributional-code-for-value-in-dopamine-based-reinforcement-learning [9]: https://deepmind.com/research/publications/AlphaFold-Improved-protein-structure-prediction-using-potentials-from-deep-learning [10]: https://deepmind.com/research/publications/The-Incentives-that-Shape-Behaviour [11]: https://deepmind.com/research/publications/Modeling-AGI-Safety-Frameworks-with-Causal-Influence-Diagrams [12]: https://deepmind.com/research/publications/Meta-learning-Sequential-Strategies [13]: https://deepmind.com/research/publications/AlphaFold-Improved-protein-structure-prediction-using-potentials-from-deep-learning [14]: https://deepmind.com/research/publications/AlphaStar-Grandmaster-level-in-StarCraft-II-using-multi-agent-reinforcement-learning [15]: https://deepmind.com/research/publications/capture-the-flag